Re: [Python-es] Problemas con expresión regular

2010-05-18 Por tema Chema Cortes
El día 18 de mayo de 2010 02:50, Andreina Mejia andreiname...@gmail.com escribió: Si imprime bien, pero el problema está en que las palabras que contiene Diccionario.txt no están en utf-8 por lo que no me corrige las palabras acentuadas o las q tengan 'ñ'... por eso la salida es del tipo

Re: [Python-es] Problemas con expresión regular

2010-05-18 Por tema Narcis Garcia - GiLUG
Yo convertiría el diccionario por ejemplo con el editor de texto plano de Gnome (gedit): abrir el fichero, 'guardar como', y seleccionar UTF8 en el desplegable de la codificación de carácteres. En/na Chema Cortes ha escrit: El día 18 de mayo de 2010 02:50, Andreina Mejia

Re: [Python-es] Problemas con expresión regular

2010-05-17 Por tema Raul Jimenez
2010/5/16 Andreina Mejia andreiname...@gmail.com: Hola a todos! Estoy haciendo un pequeño programa que encuentre todas las palabras incluyendo las acentuadas de un gran texto y las almacene en un string. Intenté con la expresión regular [a-zA-Záéíóúñ]+: Nota lingüística: no te olvides de la

Re: [Python-es] Problemas con expresión regular

2010-05-17 Por tema Juan Ignacio
Seguramente es un discrepancia entre la codificación de tu código python y la codificación de los datos que estés leyendo. Fíjate en la primera línea de código de Rolando, empieza con: # -*- coding: utf-8 -*- Este indica al interprete que el programa esta codificado en utf-8; si tus datos

Re: [Python-es] Problemas con expresión regular

2010-05-17 Por tema Andreina Mejia
Uh... bueno aquí coloco el código con las pequeñas modificaciones que he hecho para probar: #!/usr/bin/env python # -*- coding: utf-8 -*- import re, collections def words(text): text.lower() return re.findall('\w+', 'í'.decode('utf-8'), re.UNICODE) #Para probar si reconoce las

Re: [Python-es] Problemas con expresión regular

2010-05-17 Por tema Rolando Espinoza La Fuente
2010/5/17 Andreina Mejia andreiname...@gmail.com: [...] def correct(word):     candidates = known([word]) or known(edits1(word)) or known_edits2(word) or [word]     key=NWORDS.get     print candidates     print key prueba con: print ', '.join(candidates) if __name__=='__main__':   

Re: [Python-es] Problemas con expresión regular

2010-05-17 Por tema Patricio Valarezo Lozano
Andreina Mejia wrote: Si imprime bien, pero el problema está en que las palabras que contiene Diccionario.txt no están en utf-8 por lo que no me corrige las palabras acentuadas o las q tengan 'ñ'... por eso la salida es del tipo d\xc3\xada. Cómo hago para colocar todo el contenido de