Re: [Python-es] Distintos Encodings en Python

2018-11-01 Por tema Angel Lis
Creo que estas dandole demasiadas vueltas. Mi recomendacion es que trabajes siempre con unicode. Por lo que explicas quieres algo asi: ~~~ Python import urllib from bs4 import BeautifulSoup url = 'https://www.yandex.ru/' req = urllib.request.Request(url, data=No

Re: [Python-es] Distintos Encodings en Python

2018-11-01 Por tema Ander Garmendia
Hola, tiene pinta de que al scrapear la página no estás ulizando el codec adecuado (creo que pusiste cp1251) y por lo tanto el programa no es capaz de interpretar el texto. Primero, cerciorarte del encoding que están ulizando esas páginas web y utiliza ese encoding en BeautifulSoup para obtener e

Re: [Python-es] Distintos Encodings en Python

2018-11-01 Por tema Pixu Kideak
Hola, En la prueba que estoy realizando, utilizo BeautifulSoup [ https://www.crummy.com/software/BeautifulSoup/bs4/doc/] con Python 3.7. Mi objetivo es mediante BeautifulSoup tener todo el código de la página y por ejemplo almacenar el título de ésta en un fichero CSV. (En realidad se tratan de m

Re: [Python-es] Distintos Encodings en Python

2018-11-01 Por tema Angel Lis
Hola, en Python3 todo texto es unicode por defecto y el encoding del source es siempre unicode. En este pagina te lo explica: https://docs.python.org/3.0/whatsnew/3.0.html#text-vs-data-instead-of-unicode-vs-8-bit Un saludo. El mié., 31 oct. 2018 a las 14:24, Sergio Fernández () escribió: > Prime

Re: [Python-es] Distintos Encodings en Python

2018-10-31 Por tema Sergio Fernández
Primero, definiendo en la cabecera de tus ficheros https://docs.python.org/2.3/whatsnew/section-encodings.html #!/usr/bin/env python # -*- coding: UTF-8 -*- Segundo, defiendo explicitamente el encoding cuando abres ficheros para lectura/escritura: open('some.csv', encoding='utf-8') On Wed,

Re: [Python-es] Distintos Encodings en Python

2018-10-31 Por tema Pixu Kideak
Gracias por el consejo Sergio. ¿Cómo podría forzar a que el script / app fuera obligado a utilizar Unicode? Saludos ;-) On Wed, 31 Oct 2018 at 13:44, Sergio Fernández wrote: > Utiliza siempre un encoding independiente de la plataforma que soporte el > juego de caracteres que necesitas. Unicod

Re: [Python-es] Distintos Encodings en Python

2018-10-31 Por tema Sergio Fernández
Utiliza siempre un encoding independiente de la plataforma que soporte el juego de caracteres que necesitas. Unicode es tu amigo ;-) On Wed, Oct 31, 2018 at 5:36 AM Pixu Kideak wrote: > Hola, > > Estoy trabajando en un entorno Windows con Python 3.7 y según veo en el > encoding utilizo cp1252 -

[Python-es] Distintos Encodings en Python

2018-10-31 Por tema Pixu Kideak
Hola, Estoy trabajando en un entorno Windows con Python 3.7 y según veo en el encoding utilizo cp1252 - windows -1252 Western Europe. Quiero obtener información de una web con caracteres rusos y guardar la información en un fichero CSV. Según he visto el encoding necesario es cp1251 - windows -