Para mi bigData es la capacidad de guardar todo para hacer mineria de datos.
##### Google primer link ####
big data
Definiciones en la Web
Big Data es en el sector de tecnologías de la información y la
comunicación una referencia a los sistemas que manipulan grandes
conjuntos de datos. Las dificultades más habituales en estos casos se
centran en la captura, el almacenado, búsqueda, compartición, análisis,
y visualización. ...
http://es.wikipedia.org/wiki/Big_data
#####
POstgres puede guardar muchos Teras desde hace mucho tiempo, ahora el
tema es poder tener algo distribuido y como accederlo de forma
eficiente, progress (no es lo mismo que postgres) dicen que pueden hacer
eso desde el 2005.
Leyendo antes de Apretar enter llegue a este proyecto, pegale una
mirada, http://files.postgres-xl.org/documentation/intro-whatis.html
On 11/4/2015 12:27 PM, Edwin Quijada wrote:
So pena de ser fusilado, que diferencias encontrarias entre BigData y
DataWarehouse, solamente el uso de JSON ??
La pregunta viene porque he implementado warehouse con Postgres y
Mondrian y me ha ido bien pero ahora este concepto aun no acabo de
digerirlo por mas que lo leo, sigo pensando que es warehouse con JSON,
ignorancia mia talvez, pero ahora como todo es nuevo pues no se
------------------------------------------------------------------------
Date: Tue, 3 Nov 2015 22:08:02 +0000
From: lennin.c...@yahoo.com
To: listas_quij...@hotmail.com; pgsql-es-ayuda@postgresql.org
Subject: Re: [pgsql-es-ayuda] BigData con PostgreSQL
On Tuesday, November 3, 2015 4:41 PM, Edwin Quijada
<listas_quij...@hotmail.com> wrote:
Estoy tratando de implementar BigData en un cliente usando Postgres. Su
bases de ddatos estan en MSSQL y PostgreSQL necesito informacion sobre
BigData con Postgres. Anteriormente use mucho Mondrian para Warehouse
con Postgres pero al parecer hay diferencias con BigData. Alguien tiene
algun material sobre Postgres con BigData que me pueda facilitar o algun
caso de exito sobre esto.
Voy arriesgarme a responder en base a mi experiencia.
He trabajado con PostgreSQL para tener algo parecido a BigData, no es
realmente BigData en PostgreSQL ya que muchas de las cosas que se
necesitan para el analisis de los datos los hago con herramientas
externas como pyhton. Ahora he usado tipos de datos JSONB para almacenar
los datos en tablas logrando mezclar SQL con NoSQL, esto me a dado muy
buenos resultados en cuestion de tiempos de respuesta, los problemas
que he encontrado hasta el momento son:
Los indices en los campos tipo JSON no siempre son eficientes
No he enontrado una manera de aplicar procesamiento en cluster al
estilos MongoDB o Hadoop
Los objetos JSONB no tiene un metodo de actualizcion por nodos del
arreglo, hay que actualizar el campo completo lo cual genera una recarga
de I/O
Para la version 9.5 hay mejoras para estos puntos ademas de funciones
(ROLLUP, CUBE y GROUPING SETS) para manipular los datos OLAP,
adicionalmente un nuevo tipo de indices de nombre BRIN aportado por
Alvaro Herrera con lo cual mejorara el consumo de recursoso al usar los
indices.
Aun sigo trabajando e investigando con esto, cualquier cosa te ayudo en
lo posible
-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripción:
http://www.postgresql.org/mailpref/pgsql-es-ayuda