Re: [Ovillo] Expresiones Regulares
Gracias Javier, Tengo que recorrer toda la BBDD, es decir tabla a tabla, leer los campos con contenido de texto, y quitar los posibles font lo que sea que encuentre, cambiar los b/b por strong y a las tablas que encuentre quitarle lo que pueda haber de código ahí y cambiarlo por una clase. Por ejemplo: font color:#FF; size=14pxtexto/font de momento lo quitaría...o le metería un span class=clase1texto/span btexto/b transformarlo en strongtexto/strong table border=1 celppading=4 cellspacing=2 style=backgrund-color:#FFresto de contenido/table transformarlo en table class=clase_tabla_borde summary= No sé cuantos tags más tendría que implementar, pero está claro que sin hacer esto, jamás el PORTAL sería accesible, ya que el contenido generado antiguamente está mal todo... He buscado en google y no he encontrado mucho o no me entero, ya que no he trabajado con expresiones regulares casi nunca y veo que es todo un mundo por explorar y que además es MUY UTIL para todo Un saludo -Mensaje original- De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] En nombre de Javier Trejo Enviado el: miércoles, 07 de febrero de 2007 23:44 Para: 'Ovillo, la lista de CSS en castellano' Asunto: Re: [Ovillo] Expresiones Regulares Construir una expresion regular no es muy difícil, es necesario conocer un poquito de la terminología empleada. Lo más importante en este momento sería saber que cosas queres reemplazar por ejemplo y donde (si en HTML o si dentro de los campos de la DDBB) Espero poder ayudarte. Saludos, Javier Trejo -- [EMAIL PROTECTED] www.tsinformatica.com.ar TEL.: 4543-4550 CEL.: 15-6485-7734 MSN: [EMAIL PROTECTED] SKYPE: javier.trejo -Mensaje original- De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] En nombre de Lista de Distribución Enviado el: Miércoles, 07 de Febrero de 2007 12:05 Para: 'Ovillo, la lista de CSS en castellano' Asunto: [Ovillo] Expresiones Regulares Buenas, Necesitaba ayuda con un tema de expresiones regulares. Estoy un proyecto que sin cambio de diseño, tiene que pasar de no ser accesible a ser accesible. El tema de maqueta y diseño, parece más o menos encauzado. Pero ahora tengo choco con el problema de los contenidos de la BBDD. Estos contenidos, desde el momento en que se ponga el nuevo proyecto en producción serán con código HTML válido, pero actualmenet, en esa BBDD hay mucho código que no sirve, ya sean font o b o cosas así... Mi idea es recorrer toda la BBDD, e ir reparando con expresiones regulares los pequeños fallos que existan, pero me cuesta mucho encontrar las expresiones que debiera usar, ya que no he trabajado nunca con ellas... alguien puede echarme una mano? Gracias ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo
Re: [Ovillo] Expresiones Regulares
Gracias David, Me has entendido, si bien lo que se guarda en la BBDD de este proyecto es contenido, no páginas, pero ese contenido tienes tags de html, como listas, enlaces, fonts etc Vamos que el último párrafo es el que tengo que realizar... Gracias por la ayuda, miraré lo del Tidy a ver que encuentro. -Mensaje original- De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] En nombre de David Castelló Enviado el: miércoles, 07 de febrero de 2007 23:46 Para: Ovillo, la lista de CSS en castellano Asunto: Re: [Ovillo] Expresiones Regulares Hola! Yo dentro de poco tendré que resolver un problema similar. Hay un contenido Html en una BBDD, el cual ha de ser limpiado para pasar a ser válido. Yo me he generado una pequeña aplicacion web que hace lo siguiente: recoge ese contenido de la bbdd y le pasa el tidy [1] especificándole unos parametros de parseo. Este proceso, me genera un fichero Html un poco mas limpio que el inicial, que es el que posteriormente le paso al validador del W3C. Los resultados del validador del W3C los almaceno, y posteriormente los parseo para generarme unas estadísticas de los errores que se han producido al validar (error mas común, número de apariciones, lugar donde se produjo, ...). Todo este proceso me sirve para ese contenido de la BBDD refinarlo y que el número total de errores a modificar posteriormente sea menor, y a su vez poder obtener un posible patrón de los errores, ya que, dependiendo de cómo esté el código inicial de mal, puede que no te escapes de tener que ir manualmente página por página modificando las cosas que no pudieron ser mejoradas. Para no saturar la web del W3C en cuanto a peticiones de validación y por agilizar la aplicación, lo más cómodo es tener instalado en tu máquina linux local, el tidy y el validador del W3C [2]. Espero haberte entendido, porque sino lo que te queda es el uso de expresiones regulares mediante algún lenguaje de script (php por ejemplo) [3] extrayendo el código de la bbdd y parseándolo, para luego volver a introducirlo. [1] http://tidy.sourceforge.net/ [2] http://validator.w3.org/source/ [3] http://www.ignside.net/man/php/regex.php [x] http://www.ignside.net/man/html-kit/tidy.php (explicacion de Tidy en español) Saludos! On 2/7/07, Lista de Distribución [EMAIL PROTECTED] wrote: Buenas, Necesitaba ayuda con un tema de expresiones regulares. Estoy un proyecto que sin cambio de diseño, tiene que pasar de no ser accesible a ser accesible. El tema de maqueta y diseño, parece más o menos encauzado. Pero ahora tengo choco con el problema de los contenidos de la BBDD. Estos contenidos, desde el momento en que se ponga el nuevo proyecto en producción serán con código HTML válido, pero actualmenet, en esa BBDD hay mucho código que no sirve, ya sean font o b o cosas así... Mi idea es recorrer toda la BBDD, e ir reparando con expresiones regulares los pequeños fallos que existan, pero me cuesta mucho encontrar las expresiones que debiera usar, ya que no he trabajado nunca con ellas... alguien puede echarme una mano? Gracias ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo -- David Castelló http://www.estandaresweb.es http://coredump.es ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo
Re: [Ovillo] Expresiones Regulares
Hola David, Lo que yo tengo que leer de cada registro de cada tabla, por poner un ejemplo, podría ser algo como esto: font color='#0033CC'bSubvenciones/b de la iConsejería/i: br a href='http://www.consejeria.com'- Asociaciones Consejerías./a br/font a Lógicamente, este texto está mal formado. No sólo tienen etiquetas que no se usan, sino que por ejemplo el último tag, está mal creado: /font a Pero voy a echar un buen vistazo a lo que me pasas del Tidy, porque me da a mí que puede ayudarme a solucionar algunos(muchos) problemas, no? De todas formas, si pudieras mandarme unas capturas(si no es mucho trabajo) te lo agradecería, y si no puedes que conste que también te agradezco la ayuda. Gracias -Mensaje original- De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] En nombre de David Castelló Enviado el: jueves, 08 de febrero de 2007 9:55 Para: Ovillo, la lista de CSS en castellano Asunto: Re: [Ovillo] Expresiones Regulares Hola de nuevo! Imagino que tu código de la BBDD puede que no sea una web completa, sino simples trozos de Html, el tidy lo que te permite es envolver ese código con unas cabeceras, e indicarle unos parametros de configuración para limpiar el código, y así formar un html completo el cual poder validar. Te indico algunos ejemplos de parametros del tidy: - Borrar atributos propietario del código - Borrar párrafos vacios - Substituir b/i por strong/em - Eliminar elementos obsoletos creándote una nueva clase - etc Esto te evitará muchos problemas, y podrás hacer una gran limpieza incial a tu código, para despues pasar a la revisión manual y/o mediante expresiones regulares. Si lo necesitas, podría mandarte unas capturas de la mini-aplicación que tengo. Saludos ! On 2/8/07, Lista de Distribución [EMAIL PROTECTED] wrote: Gracias David, Me has entendido, si bien lo que se guarda en la BBDD de este proyecto es contenido, no páginas, pero ese contenido tienes tags de html, como listas, enlaces, fonts etc Vamos que el último párrafo es el que tengo que realizar... Gracias por la ayuda, miraré lo del Tidy a ver que encuentro. -Mensaje original- De: [EMAIL PROTECTED] [mailto: [EMAIL PROTECTED] En nombre de David Castelló Enviado el: miércoles, 07 de febrero de 2007 23:46 Para: Ovillo, la lista de CSS en castellano Asunto: Re: [Ovillo] Expresiones Regulares Hola! Yo dentro de poco tendré que resolver un problema similar. Hay un contenido Html en una BBDD, el cual ha de ser limpiado para pasar a ser válido. Yo me he generado una pequeña aplicacion web que hace lo siguiente: recoge ese contenido de la bbdd y le pasa el tidy [1] especificándole unos parametros de parseo. Este proceso, me genera un fichero Html un poco mas limpio que el inicial, que es el que posteriormente le paso al validador del W3C. Los resultados del validador del W3C los almaceno, y posteriormente los parseo para generarme unas estadísticas de los errores que se han producido al validar (error mas común, número de apariciones, lugar donde se produjo, ...). Todo este proceso me sirve para ese contenido de la BBDD refinarlo y que el número total de errores a modificar posteriormente sea menor, y a su vez poder obtener un posible patrón de los errores, ya que, dependiendo de cómo esté el código inicial de mal, puede que no te escapes de tener que ir manualmente página por página modificando las cosas que no pudieron ser mejoradas. Para no saturar la web del W3C en cuanto a peticiones de validación y por agilizar la aplicación, lo más cómodo es tener instalado en tu máquina linux local, el tidy y el validador del W3C [2]. Espero haberte entendido, porque sino lo que te queda es el uso de expresiones regulares mediante algún lenguaje de script (php por ejemplo) [3] extrayendo el código de la bbdd y parseándolo, para luego volver a introducirlo. [1] http://tidy.sourceforge.net/ [2] http://validator.w3.org/source/ [3] http://www.ignside.net/man/php/regex.php [x] http://www.ignside.net/man/html-kit/tidy.php (explicacion de Tidy en español) Saludos! On 2/7/07, Lista de Distribución [EMAIL PROTECTED] wrote: Buenas, Necesitaba ayuda con un tema de expresiones regulares. Estoy un proyecto que sin cambio de diseño, tiene que pasar de no ser accesible a ser accesible. El tema de maqueta y diseño, parece más o menos encauzado. Pero ahora tengo choco con el problema de los contenidos de la BBDD. Estos contenidos, desde el momento en que se ponga el nuevo proyecto en producción serán con código HTML válido, pero actualmenet, en esa BBDD hay mucho código que no sirve, ya sean font o b o cosas así... Mi idea es recorrer toda la BBDD, e ir reparando con expresiones regulares los pequeños fallos que existan, pero me cuesta mucho encontrar las expresiones que debiera usar, ya que no he trabajado nunca con ellas... alguien puede echarme una mano? Gracias
Re: [Ovillo] Expresiones Regulares
Gracias por las molestias tomadas David. -Mensaje original- De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] En nombre de David Castelló Enviado el: jueves, 08 de febrero de 2007 17:24 Para: Ovillo, la lista de CSS en castellano Asunto: Re: [Ovillo] Expresiones Regulares Hola! Te dejo la url [1] con las capturas y una breve explicacion de lo que hace la aplicación. No se si te servira de mucho, pero espero te de ideas de como afrontarlo. [1] http://www.estandaresweb.es/pruebas/aplicacion.html Saludos! David Castelló http://www.estandaresweb.es http://coredump.es On 2/8/07, Lista de Distribución [EMAIL PROTECTED] wrote: Hola David, Lo que yo tengo que leer de cada registro de cada tabla, por poner un ejemplo, podría ser algo como esto: font color='#0033CC'bSubvenciones/b de la iConsejería/i: br a href='http://www.consejeria.com'- Asociaciones Consejerías./a br/font a Lógicamente, este texto está mal formado. No sólo tienen etiquetas que no se usan, sino que por ejemplo el último tag, está mal creado: /font a Pero voy a echar un buen vistazo a lo que me pasas del Tidy, porque me da a mí que puede ayudarme a solucionar algunos(muchos) problemas, no? De todas formas, si pudieras mandarme unas capturas(si no es mucho trabajo) te lo agradecería, y si no puedes que conste que también te agradezco la ayuda. Gracias -Mensaje original- De: [EMAIL PROTECTED] [mailto: [EMAIL PROTECTED] En nombre de David Castelló Enviado el: jueves, 08 de febrero de 2007 9:55 Para: Ovillo, la lista de CSS en castellano Asunto: Re: [Ovillo] Expresiones Regulares Hola de nuevo! Imagino que tu código de la BBDD puede que no sea una web completa, sino simples trozos de Html, el tidy lo que te permite es envolver ese código con unas cabeceras, e indicarle unos parametros de configuración para limpiar el código, y así formar un html completo el cual poder validar. Te indico algunos ejemplos de parametros del tidy: - Borrar atributos propietario del código - Borrar párrafos vacios - Substituir b/i por strong/em - Eliminar elementos obsoletos creándote una nueva clase - etc Esto te evitará muchos problemas, y podrás hacer una gran limpieza incial a tu código, para despues pasar a la revisión manual y/o mediante expresiones regulares. Si lo necesitas, podría mandarte unas capturas de la mini-aplicación que tengo. Saludos ! On 2/8/07, Lista de Distribución [EMAIL PROTECTED] wrote: Gracias David, Me has entendido, si bien lo que se guarda en la BBDD de este proyecto es contenido, no páginas, pero ese contenido tienes tags de html, como listas, enlaces, fonts etc Vamos que el último párrafo es el que tengo que realizar... Gracias por la ayuda, miraré lo del Tidy a ver que encuentro. -Mensaje original- De: [EMAIL PROTECTED] [mailto: [EMAIL PROTECTED] En nombre de David Castelló Enviado el: miércoles, 07 de febrero de 2007 23:46 Para: Ovillo, la lista de CSS en castellano Asunto: Re: [Ovillo] Expresiones Regulares Hola! Yo dentro de poco tendré que resolver un problema similar. Hay un contenido Html en una BBDD, el cual ha de ser limpiado para pasar a ser válido. Yo me he generado una pequeña aplicacion web que hace lo siguiente: recoge ese contenido de la bbdd y le pasa el tidy [1] especificándole unos parametros de parseo. Este proceso, me genera un fichero Html un poco mas limpio que el inicial, que es el que posteriormente le paso al validador del W3C. Los resultados del validador del W3C los almaceno, y posteriormente los parseo para generarme unas estadísticas de los errores que se han producido al validar (error mas común, número de apariciones, lugar donde se produjo, ...). Todo este proceso me sirve para ese contenido de la BBDD refinarlo y que el número total de errores a modificar posteriormente sea menor, y a su vez poder obtener un posible patrón de los errores, ya que, dependiendo de cómo esté el código inicial de mal, puede que no te escapes de tener que ir manualmente página por página modificando las cosas que no pudieron ser mejoradas. Para no saturar la web del W3C en cuanto a peticiones de validación y por agilizar la aplicación, lo más cómodo es tener instalado en tu máquina linux local, el tidy y el validador del W3C [2]. Espero haberte entendido, porque sino lo que te queda es el uso de expresiones regulares mediante algún lenguaje de script (php por ejemplo) [3] extrayendo el código de la bbdd y parseándolo, para luego volver a introducirlo. [1] http://tidy.sourceforge.net/ [2] http://validator.w3.org/source/ [3] http://www.ignside.net/man/php/regex.php [x] http://www.ignside.net/man/html-kit/tidy.php (explicacion de Tidy en español) Saludos! On 2/7/07, Lista de Distribución [EMAIL PROTECTED] wrote: Buenas, Necesitaba ayuda con
[Ovillo] Expresiones Regulares
Buenas, Necesitaba ayuda con un tema de expresiones regulares. Estoy un proyecto que sin cambio de diseño, tiene que pasar de no ser accesible a ser accesible. El tema de maqueta y diseño, parece más o menos encauzado. Pero ahora tengo choco con el problema de los contenidos de la BBDD. Estos contenidos, desde el momento en que se ponga el nuevo proyecto en producción serán con código HTML válido, pero actualmenet, en esa BBDD hay mucho código que no sirve, ya sean font o b o cosas así... Mi idea es recorrer toda la BBDD, e ir reparando con expresiones regulares los pequeños fallos que existan, pero me cuesta mucho encontrar las expresiones que debiera usar, ya que no he trabajado nunca con ellas... alguien puede echarme una mano? Gracias ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo
Re: [Ovillo] Expresiones Regulares
Construir una expresion regular no es muy difícil, es necesario conocer un poquito de la terminología empleada. Lo más importante en este momento sería saber que cosas queres reemplazar por ejemplo y donde (si en HTML o si dentro de los campos de la DDBB) Espero poder ayudarte. Saludos, Javier Trejo -- [EMAIL PROTECTED] www.tsinformatica.com.ar TEL.: 4543-4550 CEL.: 15-6485-7734 MSN: [EMAIL PROTECTED] SKYPE: javier.trejo -Mensaje original- De: [EMAIL PROTECTED] [mailto:[EMAIL PROTECTED] En nombre de Lista de Distribución Enviado el: Miércoles, 07 de Febrero de 2007 12:05 Para: 'Ovillo, la lista de CSS en castellano' Asunto: [Ovillo] Expresiones Regulares Buenas, Necesitaba ayuda con un tema de expresiones regulares. Estoy un proyecto que sin cambio de diseño, tiene que pasar de no ser accesible a ser accesible. El tema de maqueta y diseño, parece más o menos encauzado. Pero ahora tengo choco con el problema de los contenidos de la BBDD. Estos contenidos, desde el momento en que se ponga el nuevo proyecto en producción serán con código HTML válido, pero actualmenet, en esa BBDD hay mucho código que no sirve, ya sean font o b o cosas así... Mi idea es recorrer toda la BBDD, e ir reparando con expresiones regulares los pequeños fallos que existan, pero me cuesta mucho encontrar las expresiones que debiera usar, ya que no he trabajado nunca con ellas... alguien puede echarme una mano? Gracias ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo
Re: [Ovillo] Expresiones Regulares
Hola! Yo dentro de poco tendré que resolver un problema similar. Hay un contenido Html en una BBDD, el cual ha de ser limpiado para pasar a ser válido. Yo me he generado una pequeña aplicacion web que hace lo siguiente: recoge ese contenido de la bbdd y le pasa el tidy [1] especificándole unos parametros de parseo. Este proceso, me genera un fichero Html un poco mas limpio que el inicial, que es el que posteriormente le paso al validador del W3C. Los resultados del validador del W3C los almaceno, y posteriormente los parseo para generarme unas estadísticas de los errores que se han producido al validar (error mas común, número de apariciones, lugar donde se produjo, ...). Todo este proceso me sirve para ese contenido de la BBDD refinarlo y que el número total de errores a modificar posteriormente sea menor, y a su vez poder obtener un posible patrón de los errores, ya que, dependiendo de cómo esté el código inicial de mal, puede que no te escapes de tener que ir manualmente página por página modificando las cosas que no pudieron ser mejoradas. Para no saturar la web del W3C en cuanto a peticiones de validación y por agilizar la aplicación, lo más cómodo es tener instalado en tu máquina linux local, el tidy y el validador del W3C [2]. Espero haberte entendido, porque sino lo que te queda es el uso de expresiones regulares mediante algún lenguaje de script (php por ejemplo) [3] extrayendo el código de la bbdd y parseándolo, para luego volver a introducirlo. [1] http://tidy.sourceforge.net/ [2] http://validator.w3.org/source/ [3] http://www.ignside.net/man/php/regex.php [x] http://www.ignside.net/man/html-kit/tidy.php (explicacion de Tidy en español) Saludos! On 2/7/07, Lista de Distribución [EMAIL PROTECTED] wrote: Buenas, Necesitaba ayuda con un tema de expresiones regulares. Estoy un proyecto que sin cambio de diseño, tiene que pasar de no ser accesible a ser accesible. El tema de maqueta y diseño, parece más o menos encauzado. Pero ahora tengo choco con el problema de los contenidos de la BBDD. Estos contenidos, desde el momento en que se ponga el nuevo proyecto en producción serán con código HTML válido, pero actualmenet, en esa BBDD hay mucho código que no sirve, ya sean font o b o cosas así... Mi idea es recorrer toda la BBDD, e ir reparando con expresiones regulares los pequeños fallos que existan, pero me cuesta mucho encontrar las expresiones que debiera usar, ya que no he trabajado nunca con ellas... alguien puede echarme una mano? Gracias ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo -- David Castelló http://www.estandaresweb.es http://coredump.es ___ Lista de distribución Ovillo Para escribir a la lista, envia un correo a Ovillo@lists.ovillo.org Puedes modificar tus datos o desuscribirte en la siguiente dirección: http://lists.ovillo.org/mailman/listinfo/ovillo