Hola David,

Lo que yo tengo que leer de cada registro de cada tabla, por poner un
ejemplo, podría ser algo como esto:

<font color='#0033CC'><b>Subvenciones</b> de la <i>Consejería</i>:
<br>
<a href='http://www.consejeria.com'>- Asociaciones Consejerías.</a>
<br>--------------------------------</font a>


Lógicamente, este texto está mal formado. No sólo tienen etiquetas que no se
usan, sino que por ejemplo el último tag, está mal creado: </font a>

Pero voy a echar un buen vistazo a lo que me pasas del Tidy, porque me da a
mí que puede ayudarme a solucionar algunos(muchos) problemas, no?

De todas formas, si pudieras mandarme unas capturas(si no es mucho trabajo)
te lo agradecería, y si no puedes que conste que también te agradezco la
ayuda.

Gracias







-----Mensaje original-----
De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED]
En nombre de David Castelló
Enviado el: jueves, 08 de febrero de 2007 9:55
Para: Ovillo, la lista de CSS en castellano
Asunto: Re: [Ovillo] Expresiones Regulares

Hola de nuevo!
Imagino que tu código de la BBDD puede que no sea una web completa, sino
simples trozos de Html, el tidy lo que te permite es envolver ese código con
unas cabeceras, e indicarle unos parametros de configuración para limpiar el
código, y así formar un html completo el cual poder validar.
Te indico algunos ejemplos de parametros del tidy:
- Borrar atributos propietario del código
- Borrar párrafos vacios
- Substituir b/i por strong/em
- Eliminar elementos obsoletos creándote una nueva clase
- etc

Esto te evitará muchos problemas, y podrás hacer una gran limpieza incial a
tu código, para despues pasar a la revisión manual y/o mediante expresiones
regulares.
Si lo necesitas, podría mandarte unas capturas de la mini-aplicación que
tengo.

Saludos !

On 2/8/07, Lista de Distribución <[EMAIL PROTECTED]> wrote:
>
> Gracias David,
>
> Me has entendido, si bien lo que se guarda en la BBDD de este proyecto 
> es contenido, no páginas, pero ese contenido tienes tags de html, como 
> listas, enlaces, fonts etc
>
> Vamos que el último párrafo es el que tengo que realizar...
>
> Gracias por la ayuda, miraré lo del Tidy a ver que encuentro.
>
>
>
> -----Mensaje original-----
> De: [EMAIL PROTECTED] [mailto:
> [EMAIL PROTECTED]
> En nombre de David Castelló
> Enviado el: miércoles, 07 de febrero de 2007 23:46
> Para: Ovillo, la lista de CSS en castellano
> Asunto: Re: [Ovillo] Expresiones Regulares
>
> Hola!
>
> Yo dentro de poco tendré que resolver un problema similar. Hay un 
> contenido Html en una BBDD, el cual ha de ser limpiado para pasar a 
> ser válido.
> Yo me he generado una pequeña aplicacion web que hace lo siguiente: 
> recoge ese contenido de la bbdd y le pasa el tidy [1] especificándole 
> unos parametros de "parseo". Este proceso, me genera un fichero Html 
> un poco mas limpio que el inicial, que es el que posteriormente le 
> paso al validador del W3C.
> Los resultados del validador del W3C los almaceno, y posteriormente 
> los parseo para generarme unas estadísticas de los errores que se han 
> producido al validar (error mas común, número de apariciones, lugar 
> donde se produjo, ...).
> Todo este proceso me sirve para ese contenido de la BBDD refinarlo y 
> que el número total de errores a modificar posteriormente sea menor, y 
> a su vez poder obtener un posible patrón de los errores, ya que, 
> dependiendo de cómo esté el código inicial de "mal", puede que no te 
> escapes de tener que ir manualmente página por página modificando las 
> cosas que no pudieron ser mejoradas.
>
> Para no saturar la web del W3C en cuanto a peticiones de validación y 
> por agilizar la aplicación, lo más cómodo es tener instalado en tu 
> máquina linux local, el tidy y el validador del W3C [2].
>
> Espero haberte entendido, porque sino lo que te queda es el uso de 
> expresiones regulares mediante algún lenguaje de script (php por 
> ejemplo) [3] extrayendo el código de la bbdd y parseándolo, para luego 
> volver a introducirlo.
>
> [1] http://tidy.sourceforge.net/
> [2] http://validator.w3.org/source/
> [3] http://www.ignside.net/man/php/regex.php
> [x] http://www.ignside.net/man/html-kit/tidy.php (explicacion de Tidy 
> en
> español)
>
> Saludos!
>
> On 2/7/07, Lista de Distribución <[EMAIL PROTECTED]> wrote:
> >
> > Buenas,
> >
> > Necesitaba ayuda con un tema de expresiones regulares. Estoy un 
> > proyecto que sin cambio de diseño, tiene que pasar de no ser 
> > accesible a ser accesible.
> > El tema de maqueta y diseño, parece más o menos encauzado. Pero 
> > ahora tengo choco con el problema de los contenidos de la BBDD. 
> > Estos contenidos, desde el momento en que se ponga el nuevo proyecto 
> > en producción serán con código HTML válido, pero actualmenet, en esa 
> > BBDD hay mucho código que no sirve, ya sean <font o <b> o cosas así...
> >
> > Mi idea es recorrer toda la BBDD, e ir reparando con expresiones 
> > regulares los "pequeños fallos" que existan, pero me cuesta mucho 
> > encontrar las expresiones que debiera usar, ya que no he trabajado 
> > nunca
> con ellas...
> > alguien puede echarme una mano?
> >
> > Gracias
> >
> > _______________________________________________
> > Lista de distribución Ovillo
> > Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org 
> > Puedes modificar tus datos o desuscribirte en la siguiente dirección:
> > http://lists.ovillo.org/mailman/listinfo/ovillo
> >
>
>
>
> --
> David Castelló
> http://www.estandaresweb.es
> http://coredump.es
> _______________________________________________
> Lista de distribución Ovillo
> Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org 
> Puedes modificar tus datos o desuscribirte en la siguiente dirección:
> http://lists.ovillo.org/mailman/listinfo/ovillo
>
> _______________________________________________
> Lista de distribución Ovillo
> Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org 
> Puedes modificar tus datos o desuscribirte en la siguiente dirección:
> http://lists.ovillo.org/mailman/listinfo/ovillo
>



--
David Castelló
http://www.estandaresweb.es
http://coredump.es
_______________________________________________
Lista de distribución Ovillo
Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes
modificar tus datos o desuscribirte en la siguiente dirección:
http://lists.ovillo.org/mailman/listinfo/ovillo

_______________________________________________
Lista de distribución Ovillo
Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org
Puedes modificar tus datos o desuscribirte en la siguiente dirección: 
http://lists.ovillo.org/mailman/listinfo/ovillo

Responder a