El día 18 de mayo de 2010 02:50, Andreina Mejia
andreiname...@gmail.com escribió:
Si imprime bien, pero el problema está en que las palabras que contiene
Diccionario.txt no están en utf-8 por lo que no me corrige las palabras
acentuadas o las q tengan 'ñ'... por eso la salida es del tipo
Yo convertiría el diccionario por ejemplo con el editor de texto plano
de Gnome (gedit): abrir el fichero, 'guardar como', y seleccionar UTF8
en el desplegable de la codificación de carácteres.
En/na Chema Cortes ha escrit:
El día 18 de mayo de 2010 02:50, Andreina Mejia
2010/5/16 Andreina Mejia andreiname...@gmail.com:
Hola a todos!
Estoy haciendo un pequeño programa que encuentre todas las palabras
incluyendo las acentuadas de un gran texto y las almacene en un string.
Intenté con la expresión regular [a-zA-Záéíóúñ]+:
Nota lingüística:
no te olvides de la
Seguramente es un discrepancia entre la codificación de tu código python y
la codificación de los datos que estés leyendo. Fíjate en la primera línea
de código de Rolando, empieza con:
# -*- coding: utf-8 -*-
Este indica al interprete que el programa esta codificado en utf-8; si tus
datos
Uh... bueno aquí coloco el código con las pequeñas modificaciones que he
hecho para probar:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import re, collections
def words(text):
text.lower()
return re.findall('\w+', 'í'.decode('utf-8'), re.UNICODE) #Para probar
si reconoce las
2010/5/17 Andreina Mejia andreiname...@gmail.com:
[...]
def correct(word):
candidates = known([word]) or known(edits1(word)) or known_edits2(word)
or [word]
key=NWORDS.get
print candidates
print key
prueba con:
print ', '.join(candidates)
if __name__=='__main__':
Andreina Mejia wrote:
Si imprime bien, pero el problema está en que las palabras que contiene
Diccionario.txt no están en utf-8 por lo que no me corrige las palabras
acentuadas o las q tengan 'ñ'... por eso la salida es del tipo d\xc3\xada.
Cómo hago para colocar todo el contenido de