On 08/20/2013 10:47, Flavio Henrique Araque Gurgel wrote:
Em 20-08-2013 10:03, Jean Pereira escreveu:
Bom dia.
Ontem a noite o banco travou aqui para mim, em um situação estranha.
Tenho o banco instalado em um DELL PE R815 + DELL MD3200 (ligação SAS
6Gb), rodando Centos 6.4 (Linux olosdb01.olostech.local
2.6.32-358.14.1.el6.x86_64 #1 SMP Tue Jul 16 23:51:20 UTC 2013 x86_64
x86_64 x86_64 GNU/Linux) e PostgreSQL (9.2.4 on
x86_64-unknown-linux-gnu, compiled by gcc (GCC) 4.4.7 20120313 (Red Hat
4.4.7-3), 64-bit).
Gostei disso aqui. Bastante informação útil.
Já tive um problema sério com essa maquina, que no qual existia um
problema com o modulo de video, o que fazia todas as CPUs travarem em
100%, e a unica solução para ela voltar a funcionar era utilizando o
botão power.
Mas dessa vez aparentemente o servidor estava OK, e somente o postgres
não respondia, simplismente não o conseguia nem mesmo parar ele.
Só para constar, não apareceu nada em log algum (dmesg, messages, do
postgres, etc..), nada mesmo.
Como não tinha como matar os processos do banco foi obrigado a dar um
reboot, que no qual também não foi bem sucedido, que no qual ficou
travado no ponto de montagem para com a storage (o OS não conseguia
desmontar a unidade, nem a pau). A solução foi no botão power mesmo.
Duas coisas devem ter acontecido:
1) o S.O. não quis desmontar a unidade porque tinha escrita pendente e
ele estava inacessível;
2) o PostgreSQL não pode ser parado tão facilmente quando tem conexões
ainda e, talvez, transações em andamento.
Gostaria de uma opinião de vocês, já que conhecem melhor o banco.
Eu acredito que seja problema com o servidor e não com o postgres, mas
em todos os casos não custa perguntar, talvez alguem já tenha passado
por isso ou seja um bug e tal.
Olhe novamente no messages. Procure por indisponibilidade um (ou mais)
canais de fibra pro Storage. Já aconteceu comigo de fibra cair e
voltar, mesmo que rapidamente, é o suficiente pra bagunçar as coisas
de uma forma bem "bacana".
Flavio, pior que não tem nada no messages mesmo, isso que está me
deixando com a pulga atrás da orelha.
Sobre os cabos, conferi eles no ato, mesmo assim, pela "lógica", tenho
redundancia de HBA e de Modulo controlador, na teoria 1 cabo não deveria
dar isso, eu não tenho muita experiencia em hardware, mais acho eu que
não deveria.
Pergunta: qual sistema de arquivos está usando, e quantos pontos de
montagem estão disponíveis para o banco?
ext4
Segue mais informações:
[root@olosdb01 ~]# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 49G 3.0G 43G 7% /
tmpfs 32G 0 32G 0% /dev/shm
/dev/mapper/mpathcp1 1.4T 94G 1.2T 8% /opt/md3200/pgdata
/dev/mapper/mpathbp1 275G 1.3G 260G 1% /opt/md3200/pgxlog
/dev/sda5 283G 37G 232G 14% /usr/local/pgsql
/dev/sda2 97G 279M 91G 1% /var/log
[root@olosdb01 ~]# multipath -ll
mpathc (36d4ae52000996c410000085151dbf626) dm-1 DELL,MD32xx
size=1.4T features='3 queue_if_no_path pg_init_retries 50'
hwhandler='1 rdac' wp=rw
|-+- policy='round-robin 0' prio=6 status=active
| |- 1:0:0:1 sdc 8:32 active ready running
| `- 2:0:1:1 sdi 8:128 active ready running
`-+- policy='round-robin 0' prio=1 status=enabled
|- 1:0:1:1 sde 8:64 active ghost running
`- 2:0:0:1 sdg 8:96 active ghost running
mpathb (36d4ae5200099721d0000081d51dbf5b8) dm-0 DELL,MD32xx
size=279G features='3 queue_if_no_path pg_init_retries 50'
hwhandler='1 rdac' wp=rw
|-+- policy='round-robin 0' prio=6 status=active
| |- 1:0:1:0 sdd 8:48 active ready running
| `- 2:0:0:0 sdf 8:80 active ready running
`-+- policy='round-robin 0' prio=1 status=enabled
|- 1:0:0:0 sdb 8:16 active ghost running
`- 2:0:1:0 sdh 8:112 active ghost running
[]s
__________________________________
Flavio Henrique A. Gurgel
Líder de Projetos Especiais
Consultoria, Projetos & Treinamentos 4LINUX
Tel1: +55-11.2125-4747 ou 2125-4748
www.4linux.com.br
email: fla...@4linux.com.br
______________________________
FREE SOFTWARE SOLUTIONS
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral