Pessoal ,
estou a 5 anos trabalhando com Big Data em diversas plataformas e agora
estou tendo de configurar um ambiente com muitas conexões e com alta
disponibilidade no PostgreSQL , com gravação de muitos dados por segundo
e muitas consultas grandes.
São em torno de 12.000 conexões simultaneas que estou gerenciando com
pgbouncer (funciona bem) e um tráfego de dados de 300MG/ constante pela
rede entre aplicação e Database!
Agora estamos na fase de fazer a banco "crescer horizontalmente" no
processamento e em alocação de dados , estamos estudando formas de
replicação tendo como prérequisito manter a estrutura de particionamento
já existente... quero dobrar a capacidade ( 25.000 conexões e 1GB de
trafego constante de dados ) em Hadoop e Cassandra sei fazem bem isso
mas em PostgreSQL gostaria de uma visão de alguem que já implementou
alguma extensão em produção ou tem alguma dica que eu posso considerar
em minhas analises.
posso apontar a aplicação para qualquer nó do cluster ou usar o
pacemaker para isso!
Estou entre postgres-XL que suporta OLTP e OLAP e pg_shard como outra
possibilidade ( conheço o Postgres-XL mas nunca usei pg_shard em produção)
cada um tem sua vantegens e desvantagens!
Ou um Mix de replicação do PostgreSQL com pacemaker (Linux-HA )
Quem pode dar alguma diga de outra opção que tenha um case já funcional ?
Grande abraço!
--
Marcio Junior Vieira - Data Scientist
Ambiente Livre Tecnologia - Soluções em Software Livre
http://www.ambientelivre.com.br
Telefone: +55 41 3308-3438
Twitter: @ambientelivre @marciojvieira skype: marciojv
Blog: blogs.ambientelivre.com.br/marcio
Facebook: http://www.facebook.com/ambientelivre
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral