Por error se lo envíe a Álvaro Herrera y no a la lista.

---------- Mensaje reenviado ----------
De: Guillermo O. Burastero <linux...@gmail.com>
Fecha: 31 de octubre de 2013 21:16
Asunto: Re: [pgsql-es-ayuda] Como comprimir datos en postgresql
Para: Alvaro Herrera <alvhe...@2ndquadrant.com>


Para archivar muchos documentos recomiendo considerar el formato de
archivo contenedor djvu sobre el pdf. Es mucho más eficiente (comprime
mucho más a igual calidad) y rápido para mostrar. Se puede guardar
texto embebido en el pdf cuando se escanea y hace OCR automáticamente
para tener un archivo de imagen con texto buscable.

ref. http://djvu.org/
http://es.wikipedia.org/wiki/DjVu

El día 29 de octubre de 2013 11:59, Alvaro Herrera
<alvhe...@2ndquadrant.com> escribió:
> Lazaro Ruben Garcia Martinez escribió:
>> Buenas noches a todos en la lista. Me encuentro trabajando en un
>> proyecto donde es necesario almacenar en la base de datos un conjunto
>> de documentos necesarios para la realización de un trámite de
>> vivienda, sucede que no es posible personalizar los oficios en tablas
>> de la base de datos pues no poseen una plantilla común, y el traspaso
>> del documento al sistema mediante la aplicación puede generar error en
>> la entrada de datos, además existen clientes que en ocasiones llegan
>> con nuevos oficios, de ahi la necesidad de buscar una alternativa que
>> pudiera ser escanear los documentos y persistirlos en la base de
>> datos, pero esto traería como inconveniente que la base de datos
>> cresca considerablemente. Por tal razón, acudo a ustedes para ver si
>> me pueden dar nuevas ideas, o si es que existe algún mecanismo en
>> postgres o algún módulo extra que permita almacenar la información
>> comprimida en la base de datos, para de esta forma ahorrar espacio en
>> disco y por consecuente evitar que la base cresca muy rápido.
>
> Algunos formatos de archivo son comprimidos internamente, como los PDF
> (no sé si son todos o si depende de la herramienta que los genere).
> Puedes ganar un poco de espacio extra volviendo a comprimirlos con una
> herramienta externa de compresión, pero es poco.
>
> Lo que yo te sugeriría es almacenar los PDF dentro de la BD en un campo
> bytea (tamaño máximo 1GB si mal no recuerdo, lo cual debería acomodar
> cualquier documento normal).  No exagerando con la calidad al escanear,
> el uso de espacio debería ser razonable.  Ojo: Postgres comprime al
> insertar.  Si vas a insertar datos ya comprimidos (PDFs), vas a gastar
> CPU tratando de comprimir infructuosamente.  En estos casos puede ser
> buena idea desactivar la compresión de Postgres (ALTER TABLE .. SET
> STORAGE EXTERNAL).
>
> Si la BD crece, pues crece.  Asúmelo (y asegúrate de tener suficiente
> espacio).
>
> --
> Álvaro Herrera                http://www.2ndQuadrant.com/
> PostgreSQL Development, 24x7 Support, Training & Services
>
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
> Para cambiar tu suscripción:
> http://www.postgresql.org/mailpref/pgsql-es-ayuda



--
Guillermo O. Burastero

Bahía Blanca, Buenos Aires, Argentina
Tel. +54 (291) 454-6132 - Móvil [15] 574-3173

MSN: guillermo.burast...@gmail.com
ICQ: 97148268
Usuario GNU/Linux #84879 - https://linuxcounter.net/user/84879.html


-- 
Guillermo O. Burastero

Bahía Blanca, Buenos Aires, Argentina
Tel. +54 (291) 454-6132 - Móvil [15] 574-3173

MSN: guillermo.burast...@gmail.com
ICQ: 97148268
Usuario GNU/Linux #84879 - https://linuxcounter.net/user/84879.html

-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripción:
http://www.postgresql.org/mailpref/pgsql-es-ayuda

Responder a