Pessoal ,

estou a 5 anos trabalhando com Big Data em diversas plataformas e agora estou tendo de configurar um ambiente com muitas conexões e com alta disponibilidade no PostgreSQL , com gravação de muitos dados por segundo e muitas consultas grandes.

São em torno de 12.000 conexões simultaneas que estou gerenciando com pgbouncer (funciona bem) e um tráfego de dados de 300MG/ constante pela rede entre aplicação e Database!

Agora estamos na fase de fazer a banco "crescer horizontalmente" no processamento e em alocação de dados , estamos estudando formas de replicação tendo como prérequisito manter a estrutura de particionamento já existente... quero dobrar a capacidade ( 25.000 conexões e 1GB de trafego constante de dados ) em Hadoop e Cassandra sei fazem bem isso mas em PostgreSQL gostaria de uma visão de alguem que já implementou alguma extensão em produção ou tem alguma dica que eu posso considerar em minhas analises.

posso apontar a aplicação para qualquer nó do cluster ou usar o pacemaker para isso!

Estou entre postgres-XL que suporta OLTP e OLAP e pg_shard como outra possibilidade ( conheço o Postgres-XL mas nunca usei pg_shard em produção)

cada um tem sua vantegens e desvantagens!

Ou um Mix de replicação do PostgreSQL com pacemaker (Linux-HA )

Quem pode dar alguma diga de outra opção que tenha um case já funcional ?

Grande abraço!




--
Marcio Junior Vieira - Data Scientist
Ambiente Livre Tecnologia - Soluções em Software Livre
http://www.ambientelivre.com.br
Telefone: +55 41 3308-3438
Twitter: @ambientelivre @marciojvieira skype: marciojv
Blog: blogs.ambientelivre.com.br/marcio
Facebook: http://www.facebook.com/ambientelivre
        

_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a