On 5/6/10, Andrés P.P. <solopostg...@gmail.com> wrote:
>
>
> Hola
>
> En mi trabajo, hasta ahora, he trabajado con modelos transaccionales y
> otros para reportes..y en este último caso sobre información fácilmente
> manejable (en cuanto a cantidad de registros....).....estamos hablando de
> estadísticas obtenidas a partir de archivos de texto que tienen las
> transacciones del cliente y que al día pueden ser 20 millones de
> registros.... y que al pasar a la BD terminan siendo unos cientos o miles al
> día, dependiendo de la totalización o clasificación en el cálculo de las
> estadísticas....  como decía.. muy manejable.
>
> Sin embargo, se presentó un proyecto para una BD de reportes muy similar a
> los que ya manejo....pero existe una alta probabilidad que el cliente
> insista en solicitar un reporte que requiera listar el detalle de estas
> transacciones bajo algún criterio de identificación......   Para ello
> requiero insertar cada uno de estos 20 millones de registros a la BD....lo
> que al mes me significaría 600 millones... y tomando en cuenta un histórico
> estandar de 3 meses... 1800 millones de registros presentes en la BD luego
> de 3 meses de uso......
>
> Lo único que se me ocurre hasta ahora es hacer una cantidad X de tablas que
> en conjunto tengan todos estos registros y luego ver en los procedimientos
> de cálculo y de reportes los mecanismos para derivar la información o las
> consultas..... esto sin mencionar las tareas de mantención como el vacuum..
> cuando ocurra la limpieza > 90 días..
>
> Me imagino que alguno de Uds. talvez tiene o ha tenido que diseñar una BD
> con esta cantidad de registros... Cómo lo hizo?.. Estoy dando por descartado
> tener una tabla con esa data.. ( pero desconozco las bondades del postgres
> como para asegurar ese descarte )..
>
> Lo único que sé es que será un servidor dedicado sólo a eso (sin
> especificaciones aún) y usaría el Postgres 8.4..
>
> Bueno... eso.. cualquier ayuda, comentario, link (preferentemente en
> español) se agradece..
>
> Saludos
> Andrés
>
>
Creo que lo mas conveniente es que uses algun modelo no transaccional (
modelamiento de un DataWareHouse) y un motor OLAP que te permita manejar ese
nivel de información.

Slds.

JC



-- 
Cumprimentos
jchavez
linux User #397972 on http://counter.li.org/

Responder a