On 08/20/2013 10:47, Flavio Henrique Araque Gurgel wrote:
Em 20-08-2013 10:03, Jean Pereira escreveu:
Bom dia.

Ontem a noite o banco travou aqui para mim, em um situação estranha.
Tenho o banco instalado em um DELL PE R815 + DELL MD3200 (ligação SAS
6Gb), rodando Centos 6.4 (Linux olosdb01.olostech.local
2.6.32-358.14.1.el6.x86_64 #1 SMP Tue Jul 16 23:51:20 UTC 2013 x86_64
x86_64 x86_64 GNU/Linux) e PostgreSQL (9.2.4 on
x86_64-unknown-linux-gnu, compiled by gcc (GCC) 4.4.7 20120313 (Red Hat
4.4.7-3), 64-bit).

Gostei disso aqui. Bastante informação útil.

Já tive um problema sério com essa maquina, que no qual existia um
problema com o modulo de video, o que fazia todas as CPUs travarem em
100%, e a unica solução para ela voltar a funcionar era utilizando o
botão power.
Mas dessa vez aparentemente o servidor estava OK, e somente o postgres
não respondia, simplismente não o conseguia nem mesmo parar ele.
Só para constar, não apareceu nada em log algum (dmesg, messages, do
postgres, etc..), nada mesmo.
Como não tinha como matar os processos do banco foi obrigado a dar um
reboot, que no qual também não foi bem sucedido, que no qual ficou
travado no ponto de montagem para com a storage (o OS não conseguia
desmontar a unidade, nem a pau). A solução foi no botão power mesmo.

Duas coisas devem ter acontecido:
1) o S.O. não quis desmontar a unidade porque tinha escrita pendente e ele estava inacessível; 2) o PostgreSQL não pode ser parado tão facilmente quando tem conexões ainda e, talvez, transações em andamento.

Gostaria de uma opinião de vocês, já que conhecem melhor o banco.
Eu acredito que seja problema com o servidor e não com o postgres, mas
em todos os casos não custa perguntar, talvez alguem já tenha passado
por isso ou seja um bug e tal.

Olhe novamente no messages. Procure por indisponibilidade um (ou mais) canais de fibra pro Storage. Já aconteceu comigo de fibra cair e voltar, mesmo que rapidamente, é o suficiente pra bagunçar as coisas de uma forma bem "bacana".

Flavio, pior que não tem nada no messages mesmo, isso que está me deixando com a pulga atrás da orelha. Sobre os cabos, conferi eles no ato, mesmo assim, pela "lógica", tenho redundancia de HBA e de Modulo controlador, na teoria 1 cabo não deveria dar isso, eu não tenho muita experiencia em hardware, mais acho eu que não deveria.
Pergunta: qual sistema de arquivos está usando, e quantos pontos de montagem estão disponíveis para o banco?
ext4
Segue mais informações:

   [root@olosdb01 ~]# df -h
   Filesystem            Size  Used Avail Use% Mounted on
   /dev/sda1              49G  3.0G   43G   7% /
   tmpfs                  32G     0   32G   0% /dev/shm
   /dev/mapper/mpathcp1  1.4T   94G  1.2T   8% /opt/md3200/pgdata
   /dev/mapper/mpathbp1  275G  1.3G  260G   1% /opt/md3200/pgxlog
   /dev/sda5             283G   37G  232G  14% /usr/local/pgsql
   /dev/sda2              97G  279M   91G   1% /var/log
   [root@olosdb01 ~]# multipath -ll
   mpathc (36d4ae52000996c410000085151dbf626) dm-1 DELL,MD32xx
   size=1.4T features='3 queue_if_no_path pg_init_retries 50'
   hwhandler='1 rdac' wp=rw
   |-+- policy='round-robin 0' prio=6 status=active
   | |- 1:0:0:1 sdc 8:32  active ready running
   | `- 2:0:1:1 sdi 8:128 active ready running
   `-+- policy='round-robin 0' prio=1 status=enabled
      |- 1:0:1:1 sde 8:64  active ghost running
      `- 2:0:0:1 sdg 8:96  active ghost running
   mpathb (36d4ae5200099721d0000081d51dbf5b8) dm-0 DELL,MD32xx
   size=279G features='3 queue_if_no_path pg_init_retries 50'
   hwhandler='1 rdac' wp=rw
   |-+- policy='round-robin 0' prio=6 status=active
   | |- 1:0:1:0 sdd 8:48  active ready running
   | `- 2:0:0:0 sdf 8:80  active ready running
   `-+- policy='round-robin 0' prio=1 status=enabled
      |- 1:0:0:0 sdb 8:16  active ghost running
      `- 2:0:1:0 sdh 8:112 active ghost running



[]s

__________________________________
Flavio Henrique A. Gurgel
Líder de Projetos Especiais
Consultoria, Projetos & Treinamentos 4LINUX
Tel1: +55-11.2125-4747 ou 2125-4748
www.4linux.com.br
email: fla...@4linux.com.br
______________________________
FREE SOFTWARE SOLUTIONS
_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

_______________________________________________
pgbr-geral mailing list
pgbr-geral@listas.postgresql.org.br
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a