Em 28 de junho de 2011 14:38, André Ormenese <[email protected]> escreveu:
> Flavio, > os bancos realmente estão em bancos diferentes. Os logs de transação são > (deveriam ser) copiados no slave através do rsync. No momento o rsync não > esta em operação, mas eu copiei todos os logs de transação, do master para o > slave, pelo scp, antes de dar o start do banco no slave. > > Vou resolver os problemas do rsync e testar novamente !!! > > > > Em 28 de junho de 2011 11:27, Flavio Henrique Araque Gurgel < > [email protected]> escreveu: > > > Alguma ideia do motivo pelo qual o slave não entra em mode read-only, >> vejam >> > que não tenho a seguinte informação no Log : >> > LOG: database system is ready to accept read only connections. >> >> Não entendi o seu archive_command do master. >> O servidor slave está em uma máquina separada (é o que você diz no >> início do seu email)? Como os logs de transação estão chegando lá? >> Pode ser que o servidor slave não tenha encontrado um ponto de >> reinício válido por não ter logs de transação suficientes (embora a >> mensagem de que se conectou ao master esteja presente). >> >> Não vejo uma possível causa no que você informou, mas eu investigaria >> nessa linha primeiro. >> []s >> Flavio Gurgel >> _______________________________________________ >> pgbr-geral mailing list >> [email protected] >> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral >> > > Pessoal, meus logs de transação estão sendo copiados(rsync), a cada 2 minutos, do servidor master para o slave sem problemas. Os arquivos que deixei disponíveis, são os arquivos criados na hora e posteriormente ao pg_start_backup indicados pelo 0000000200000004000000AD.00000020.backup ( no meu caso ) Qdo dou o start no slave recebo as mesmas mensagens no log : LOG: database system was interrupted; last known up at 2011-06-29 17:39:16 BRT cp: /dados/wal/hemo/00000002.history: No such file or directory LOG: entering standby mode LOG: restored log file "0000000200000004000000AD" from archive LOG: redo starts at 4/AD0000B0 LOG: restored log file "0000000200000004000000AE" from archive cp: /dados/wal/hemo/0000000200000004000000AF: No such file or directory LOG: streaming replication successfully connected to primary O arquivo ....0AF não foi encontrado pq é o arq. de transação atual no master. O hot-standby não funciona !!! Então tentei fazer o seguinte teste : Copiei o arquivo que é o gatilho para o slave começar a responder por requisições de leitura e gravação. Recebi estas mensagens no log : LOG: trigger file found: /tmp/trigger.pg901.5437 FATAL: terminating walreceiver process due to administrator command LOG: redo done at 4/AF6F89D0 LOG: last completed transaction was at log time 2011-06-30 10:45:23.725453-03 cp: /dados/wal/hemo/0000000200000004000000AF: No such file or directory FATAL: WAL ends before consistent recovery point LOG: startup process (PID 72577) exited with exit code 1 LOG: terminating any other active server processes Me parece algum problema no recovery do slave, mas sinceramente não sei por onde começar... Já verifiquei qual o primeiro WAL que o slave irá utilizar, e ele estava na pasta indicada pelo restore_command no recovery.conf. Este é o conteúdo da pasta indicada pelo restore_command : -rw------- 1 postgres wheel 16777216 Jun 29 17:40 0000000200000004000000AD -rw------- 1 postgres wheel 246 Jun 29 17:40 0000000200000004000000AD.00000020.backup -rw------- 1 postgres wheel 16777216 Jun 30 10:14 0000000200000004000000AE Verifiquei que a pasta .../data/pg_xlog estava vazia qdo o slave "startou". Alguma sugestão ??? Caso precisem de mais detalhes é só pedir !!!! Grato André
_______________________________________________ pgbr-geral mailing list [email protected] https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
