Em 20 de abril de 2017 17:12, Fabrízio de Royes Mello
<[email protected]> escreveu:
> Em 20 de abril de 2017 15:35, Tiago José Adami <[email protected]> escreveu:
>>
>> Boa tarde a todos.
>>
>> Tenho um servidor na Amazon com PostgreSQL 9.4.9 64-bit instalado, lá
>> roda uma versão do Fedora modificada.
>
> Nem preciso te dizer que deves atualizar pra 9.4.11...

Sabia que a primeira coisa que me diriam seria para atualizar ;)

E concordo plenamente, mas a instalação é do repositório oficial da
Amazon que está desatualizado. Por enquanto uma GMUD para incluir
outro repo ainda não foi discutida.

>> (...)
>> WARNING,57P02,"terminating connection because of crash of another
>> server process","The postmaster has commanded this server process to
>> roll back the current transaction and exit, because another server
>> process exited abnormally and possibly corrupted shared memory.","In a
>> moment you should be able to reconnect to the database and repeat your
>> command."
>> (...)
>
> Só tem essa informação no LOG?? Essa informação que vc pegou não é a causa e
> sim o efeito... vasculhe seu log por mais informações.

Estou vasculhando pela 3a vez os logs, mas não há nenhuma informação
adicional. Estas mensagens ocorre logo após a execução de um SQL
SELECT qualquer.


>> Nas minhas pesquisas e até onde vai meu conhecimento isto ocorre com
>> problemas de hardware, em especial, memórias (lembro-me do tempo do
>> PostgreSQL 7.4 rodando em servidores com pentes de memória de
>> velocidade e latências diferentes).
>>
>> Mas levando em consideração que o servidor está na Amazon... o que
>> mais poderia estar causando este erro? Algum palpite?
>>
>
> Eu arrisco que vc pode estar passando por algum "overcommit_memory" ou coisa
> parecida. Esse linux tem swap e como está o overcommit_memory?

O OOM e overcommit estão com os valores padrão

vm.oom_dump_tasks = 1
vm.oom_kill_allocating_task = 0
vm.overcommit_kbytes = 0
vm.overcommit_memory = 0
vm.overcommit_ratio = 50

O servidor não tem Swap.

Estava quase enviando o e-mail quando fui checar novamente o
/var/log/messages. Agradeço também ao colega Felipe Pereira (obrigado
pelas dicas), desta vez encontrei a causa mortis:

Apr 20 18:00:47 ip-172-16-4-27 kernel: [238117.075735] Killed process
2485 (postmaster) total-vm:2124064kB, anon-rss:272232kB, file-rss:4kB,
shmem-rss:1588240kB

A questão é: mesmo tendo uma quantidade de memória livre que fica
sempre entre 3 e 4 GB (livre, o resto é cache + usada), como isso pode
estar acontecendo?


Tiago J. Adami
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a