Creo que estas dandole demasiadas vueltas.
Mi recomendacion es que trabajes siempre con unicode.
Por lo que explicas quieres algo asi:
~~~ Python
import urllib
from bs4 import BeautifulSoup
url = 'https://www.yandex.ru/'
req = urllib.request.Request(url, data=No
Hola,
tiene pinta de que al scrapear la página no estás ulizando el codec
adecuado (creo que pusiste cp1251) y por lo tanto el programa no es capaz
de interpretar el texto.
Primero, cerciorarte del encoding que están ulizando esas páginas web y
utiliza ese encoding en BeautifulSoup para obtener e
Hola,
En la prueba que estoy realizando, utilizo BeautifulSoup [
https://www.crummy.com/software/BeautifulSoup/bs4/doc/] con Python 3.7.
Mi objetivo es mediante BeautifulSoup tener todo el código de la página y
por ejemplo almacenar el título de ésta en un fichero CSV. (En realidad se
tratan de m
Hola,
en Python3 todo texto es unicode por defecto y el encoding del source es
siempre unicode.
En este pagina te lo explica:
https://docs.python.org/3.0/whatsnew/3.0.html#text-vs-data-instead-of-unicode-vs-8-bit
Un saludo.
El mié., 31 oct. 2018 a las 14:24, Sergio Fernández ()
escribió:
> Prime
Primero, definiendo en la cabecera de tus ficheros
https://docs.python.org/2.3/whatsnew/section-encodings.html
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
Segundo, defiendo explicitamente el encoding cuando abres ficheros para
lectura/escritura:
open('some.csv', encoding='utf-8')
On Wed,
Gracias por el consejo Sergio.
¿Cómo podría forzar a que el script / app fuera obligado a utilizar
Unicode?
Saludos ;-)
On Wed, 31 Oct 2018 at 13:44, Sergio Fernández wrote:
> Utiliza siempre un encoding independiente de la plataforma que soporte el
> juego de caracteres que necesitas. Unicod
Utiliza siempre un encoding independiente de la plataforma que soporte el
juego de caracteres que necesitas. Unicode es tu amigo ;-)
On Wed, Oct 31, 2018 at 5:36 AM Pixu Kideak wrote:
> Hola,
>
> Estoy trabajando en un entorno Windows con Python 3.7 y según veo en el
> encoding utilizo cp1252 -
Hola,
Estoy trabajando en un entorno Windows con Python 3.7 y según veo en el
encoding utilizo cp1252 - windows -1252 Western Europe.
Quiero obtener información de una web con caracteres rusos y guardar la
información en un fichero CSV.
Según he visto el encoding necesario es cp1251 - windows -