Busqueda en backups DVD

2008-07-27 Por tema Aldrin Martoq
Gracias por las respuesta, creo que terminare haciendo una app yo...


On Fri, 2008-07-25 at 18:07 -0400, Alvaro Herrera wrote:
> Aldrin Martoq escribió:
> > Necesito hacer un backup de varios gigas en varios DVD's y el problema
> > de siempre es encontrar si en un DVD's estan los archivos...
> ¿Con qué haces los respaldos?

Por ahora con "nautilus burn:///" (CD/DVD Creator, GNOME).

> Hay herramientas como Bacula o Amanda que hacen backups y crean los
> índices respectivos.  O también puedes usar "dar" que te permite crear
> catálogos y bases de datos de los catálogos.
?On Fri, 2008-07-25 at 16:01 -0400, Herman Vega wrote:
> http://cdcollect.sourceforge.net/screenshots.php

Gracias por el Hint, sin embargo no me gustan ese enfoque al problema.
Basicamente tienes que instalar/manejar una base de datos en algun host
(cosa que ya he hecho y a mi jamas me ha resultado bien). Quizas en un
"ambiente empresarial" funciona, pero personalmente no.

Estoy buscando algo mas "autocontenido", quiero decir que el indice o
catalogo y la aplicacion para buscar permanezcan en el mismo DVD en vez
de mantener una base de datos o catalogo. Ningun programa que he visto
permite esto (ni beagle ni tracker), todos estan con el foco de que
existe un solo indice o catalogo. Una ventaja es que actualmente no
tengo como pasarle el indice a otra persona y por ende, otras personas
no se benefician del indice! La otra ventaja es que a mi no me ha
funcionado ningun catalogo...


Ademas me interesa algo multi-plataforma, por eso algo estilo HTML +
ajax + indice es lo que me tinca, pero puede ser otra tecnologia si
cumple el objetivo (no se me ocurre cual!). 


El enfoque de dar me parece interesante, quizas incluya alguna
caracteristica despues en mi app...

? 
On Fri, 2008-07-25 at 18:07 -0400, Alvaro Herrera wrote:
> > Me gustaria agregar una "simple" pagina HTML al inicio del DVD que tenga
> > el indice de todos los archivos y mediante "ajax" pueda buscar
> > dinamicamente algun archivo o string (ej: si un .odt tiene la palabra
> > "pepe") dentro de el en particular.
> Aquí creo que te fuiste al chancho ... ¿cómo vas a buscar un string al
> interior de un backup, sin almacenar el backup completo en el índice?
> Tendrías que pasarle el backup completo para que pudiera buscar ahí.

Estoy bastante seguro que el indice pesa mucho mucho menos que el
contenido. Es lo mismo que hace trackerd por ejemplo.

[dias despues]
Bien, buscando esto se llama inverted index:
http://en.wikipedia.org/wiki/Inverted_index


?On Fri, 2008-07-25 at 16:31 -0400, Carlos (casep) Sepulveda wrote:
> Has revisado el proyecto Lucene*?
> Es lo que usa Alfresco como motor de búsqueda full text search
> Hay implementaciones en varios lenguajes** (nativo java) (hay un par
> en perl y otra en php5)

Hmm voy a evaluar usar Lucene (cumple con multiplataforma, podria
incluir la app como applet java y el indice local en el CD); solo que a
estas alturas cualquier cosa Java me da dolor de guata... 


-- 
Aldrin Martoq <[EMAIL PROTECTED]>
http://aldrinvideopodcast.podshow.com/



Busqueda en backups DVD

2008-07-27 Por tema Daniel Serpell
Hola!

El Fri, Jul 25, 2008 at 03:45:58PM -0400, Aldrin Martoq escribio:
> Necesito hacer un backup de varios gigas en varios DVD's y el problema
> de siempre es encontrar si en un DVD's estan los archivos...
> 

Usa DAR, y guarda el catálogo en cada disco.

> 
> Me gustaria agregar una "simple" pagina HTML al inicio del DVD que tenga
> el indice de todos los archivos y mediante "ajax" pueda buscar
> dinamicamente algun archivo o string (ej: si un .odt tiene la palabra
> "pepe") dentro de el en particular.
> 

Usa Xapian http://xapian.org/ , hace índices de múltiples tipos de
archivo y tiene interfáz en varios lenguages.

Mi idea:

* Usar DAR para hacer los respaldos, y mantener los catálogos en tu pc.

* Usar Xapian para indizar los archivos, agregando a mano la información
  de ruta + número de dvd a la base de datos.

* Programar algo simple para buscar en la base de datos.

¡suerte!

   Daniel.
From [EMAIL PROTECTED]  Sun Jul 27 23:43:58 2008
From: [EMAIL PROTECTED] (Aldrin Martoq)
Date: Sun Jul 27 23:50:38 2008
Subject: Busqueda en backups DVD
In-Reply-To: <[EMAIL PROTECTED]>
References: <[EMAIL PROTECTED]>
<[EMAIL PROTECTED]>
Message-ID: <[EMAIL PROTECTED]>

On Fri, 2008-07-25 at 19:57 -0400, Rodrigo Fuentealba wrote:
> El 25/07/08, Aldrin Martoq <[EMAIL PROTECTED]> escribió:
> > Necesito hacer un backup de varios gigas en varios DVD's y el problema
> > de siempre es encontrar si en un DVD's estan los archivos...
> Con un programa que te los parsee?
> > Me gustaria agregar una "simple" pagina HTML al inicio del DVD que tenga
> > el indice de todos los archivos
> Bacula? algun script usando sed, xargs, etc?
> > y mediante "ajax" pueda buscar
> > dinamicamente algun archivo o string (ej: si un .odt tiene la palabra
> > "pepe") dentro de el en particular.
> !!!
> 1.- AJAX (Asynchronous Javascript And Xml) tiene su gracia en
> Internet, que puedes recuperar datos desde un cliente a un servidor.
> No sé a qué le llamas "AJAX", si no tienes servidor XML...

Bueno, asincronismo javascript dhtml y todas esas cosas que el buzzword
resume en AJAX. Estoy seguro que se puede hacer algo como lo que pido,
multiplataforma (asincronismo javascript dhtml etc) y localmente. La
parte XML la quiero obviar! ;)

Aqui una prueba, que estoy estudiando como usar:
http://www.ecosmear.com/relay/


Parece que lo top en esto es Prototype y Script.aculo.us.

> 2.- Tener un índice de los archivos implicaría (ambas):
> 2.a.- Que tengas algo así como PostgreSQL embebido usando TSearch2
> 2.b.- Que tu backup sea de 2Gb + 2Gb de datos de la PostgreSQL + el resto.

> 3.- En el mejor de los casos, a medida que vas agregando archivos al
> respaldo, puedes ir generando un índice y antes de "Burn" agregar
> también este archivo;
> algo ilógico y difícil.

Es un indice de "palabras", no tienes que hacer scan del contenido.
Basicamente una lista de palabras y cada palabra tiene una lista de
archivos que contienen dicha palabra. Luego ante una busqueda haces un
scan sobre la lista de palabras y tienes todos los archivos. Es muy
eficiente, ya tengo una aplicacion pygtk que lo esta haciendo bastante
bien y rapido sobre 70.000 archivos, por ahora solo con los nombres de
archivo, falta programar que agregue mas palabras al indice escanenado
el contenido de los documentos, pero ya con lo que tengo es bastante.

No necesitas base de datos ni nada muy complejo, la busqueda no es tan
extensa y de todas formas hay que hacer un scan de todas las palabras
(recorrer todas las filas). A menos que busques de otra forma (similitud
de palabras por ejemplo?)

Tampoco tienes el problema de las actualizaciones del indice, pues lo
regeneras de nuevo; el indice no se actualizara en un DVD o respaldo.


> Juntando todo este razonamiento, que por lo demás me parece fuera de
> lógica, puedes generar un archivo XML con el índice de datos (aún así
> es difícil) y hacer un script con algo como libxml2 para parsear
> eso... o algo así.


> > La parte del indice es facil, la parte de buscar "en linea" es la que
> > ando buscando. Alguien conoce algun software para hacer esto?
> Siempre puedes cocinar algo con find, grep, sed, awk, xargs, locate;
> en una de esas te conviene hacerte utilidades que busquen en el disco
> entero y agregar esas utilidades a cada uno de los backups.

Ya he hecho eso, y a mi no me funciona... De hecho, no encuentro el
ultimo catalogo que hice de esta forma (a punta de find's y rotulado de
discos a manopla)


-- 
Aldrin Martoq <[EMAIL PROTECTED]>
http://aldrinvideopodcast.podshow.com/



documentacion virtualizacion

2008-07-27 Por tema Ricardo Utreras Estrella
Horst H. von Brand escribió:
> Julio Saldivar <[EMAIL PROTECTED]> wrote:
>> Hola a todos necesito encontrar documentacion de virtualizacion,
>> preferentemente KVM y Xen, en español.
> 
> Aprende ingles. Lo necesitaras igual, a mas tardar cuando requiras
> descifrar algun mensaje de error vis a vis la documentacion, o buscar algo
> en las listas del caso o en Google.

Aunque la recomendacion suene como portazo en la cara, es la pura y 
santa verdad. De hecho cuando busques trabajo te daras cuenta en la 
maryoria de los casos se solicitan profesionales con un nivel de ingles 
_hablado_ alto.

En todo caso, si quieres encontrar informacion sobre XEN en español 
busca por "paravirtualizacion".

Saludos

-- 
Atte. Ricardo Utreras Estrella