Re: [Python-es] Otaku script

2013-02-12 Por tema Alexandro Colorado
2013/2/12 Chema Cortes pych...@gmail.com

 El 12 de febrero de 2013 06:24, Alexandro Colorado j...@oooes.orgescribió:

 Hola, no se cuanto fan de Anime y Manga Japonesa haya por aqui, pero tengo
 un script que jala del sitio http://www.mangareader.net/

 comics usando python, curl y beautifulsoup. Estas imagenes las mete en un
 folder que crea y titula como el comic.


 No veo que preguntes nada en concreto, así que sólo pondré algunos
 comentarios:


La pregunta es mas de deciones, seria mejor tener una clase o una serie de
condicionales para que pueda trabajar el sitio de manera transparente?




 Veo que este proyecto lo tenías parado durante 2 años. Supongo que es por
 éso que tengas desactualizado el BeautifulSoup, que anda por la versión 4.
 Por otro lado, las mejoras de las que hablas no parecen complicadas de
 implementar. Ya dirás si has encontrado algún problema.

 Tengo un proyecto[1] parecido para descargar ebooks de páginas webs.
 Utilizo la infraestructura facilitada por calibre, una utilidad bastante
 popular, hecha en python, que sirve para catalogar y transformar libros
 electrónicos (incluyendo los formatos cbr y cbz, entre otros muchos). Entre
 otras características, mis scripts trabajan en multihilo, lo que mejora
 bastante los tiempos de descarga, y es capaz de bajar los metadatos para
 incorporalos al catálogo del calibre. No creo que te sirvan de mucho mis
 scripts para mejorar el tuyo, pero sí que vería factible aprovecharlo para
 crear un nuevo scrap para el mío. Tendría que estudiarlo.


 [1]: http://hg.ch3m4.org/calibre-scrap calibre-scrap



 --
 Hyperreals *R: http://ch3m4.org/blog
 Quarks, bits y otras criaturas infinitesimales

 ___
 Python-es mailing list
 Python-es@python.org
 http://mail.python.org/mailman/listinfo/python-es
 FAQ: http://python-es-faq.wikidot.com/




-- 
Alexandro Colorado
Apache OpenOffice Contributor
http://es.openoffice.org
___
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/


Re: [Python-es] Otaku script

2013-02-12 Por tema Chema Cortes
El 12 de febrero de 2013 10:54, Alexandro Colorado j...@oooes.org escribió:


 2013/2/12 Chema Cortes pych...@gmail.com

 El 12 de febrero de 2013 06:24, Alexandro Colorado j...@oooes.orgescribió:

 Hola, no se cuanto fan de Anime y Manga Japonesa haya por aqui, pero
 tengo un script que jala del sitio http://www.mangareader.net/

 comics usando python, curl y beautifulsoup. Estas imagenes las mete en
 un folder que crea y titula como el comic.


 No veo que preguntes nada en concreto, así que sólo pondré algunos
 comentarios:


 La pregunta es mas de deciones, seria mejor tener una clase o una serie de
 condicionales para que pueda trabajar el sitio de manera transparente?


No es fácil trabajar con condicionales. Las dos webs pueden requerír
distintas estrategias para extraer la información e implementar ésto con
condicionales es muy farragoso. Mucho más adecuado es darle una orientación
a objetos, con un script principal que lleve la lógica de la extracción de
datos y luego varias clases con el método de extracción específico para
cada web.

Mi recomendación es que te construyas una API sencilla con la que se
comuniquen el método principal y los scrappers. Esta API iría como una
clase abstracta de la cuál derivarían las clases para los scrappers.



-- 
Hyperreals *R: http://ch3m4.org/blog
Quarks, bits y otras criaturas infinitesimales
___
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/