2013/9/18 Flavio Henrique Araque Gurgel <[email protected]>:
>> Em http://www.chrisstucchio.com/blog/2013/hadoop_hatred.html o autor
>> recomenda usar Hadoop quando os dados passarem de 5TB.  Achei muito
>> pouco.  O que vocês acham?
>
> Eu achei o post do cara sensacional.

Concordo!  Faltou falar isso antes de questionar um ponto específico…


> Obrigado por compartilhar conosco!

De nada, disponha!


> Ele é programador, que faz parte da categoria que adora os NoSQL pelas suas 
> supostas "facilidades" e fez uma análise crua de situações de sua vida real.

Certo.


> Eu realmente não entendo porque programador acha SQL difícil. É uma linguagem 
> simples e evita uma porção de erros, o que o autor desmistifica.

Mudança de paradigma.  Poucos programadores têm aula de programação
para além do procedural, desses que chegam a ter poucos tiveram bons
professores, e desses privilegiados menos ainda aprenderam de fato.

É como aquela estória de que MS Windows é mais fácil.  Depende, claro,
de para o quê, mas nunca foi verdade absoluta.  O que faz parecer mais
fácil é a familiaridade.


> Eu não entendi o comentário dos 5TB como "recomendação" mas como "se você já 
> tem 5TB num Hadoop você está preso nele".

Não interpretei dessa maneira, mas seria verdade.


> Realmente deve ser economicamente inviável arrancar 5TB de um NoSQL e jogar 
> num PostgreSQL. Vai precisar de uma parada enorme além de toda a refatoração 
> de aplicação, sem contar a escrita de uma ferramenta pra migração que depois 
> será abandonada.

O novo /proprietary lock‐in/.  E aproveito para lamentar pela enésima
vez que não encontro uma boa tradução para essa expressão.


> Em tempo: PostgreSQL é um dos backends usados pelo Hadoop, logo, após as 
> vantagens da redução de mapa o encontro da chave deve ser algo bastante 
> rápido.

:-)


>> Há alguma lista das maiores instalações de PostgreSQL?
>
> Nunca vi. Talvez começar a colocar na Wiki internacional.

Bota a tua lá, nem que seja só para desafiar os outros!  Ou não podes?


> Todavia, tamanho de banco é só um dos quesitos de "grande instalação".
> Um banquinho de 20GB pode ser extremamente desafiador num ambiente com alta 
> taxa transacional em OLTP.

De fato.

Até, relendo agora há pouco, percebi que parece que ele se refere a 5
TB numa única relação.  Mas, para isso, temos o particionamento, que
vai melhorando aos poucos, e o XC, idem.  Então me parece que a
afirmação de que NoSQL seria necessário acima de 5 TB é inválida,
exceto para o caso de legado NoSQL que levantaste acima.
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a