Hola

En Python puedes hacerlo utilizando urlib para obtener y parseando con
HTMLParser.

Saludos

2010/10/12 Cristiam Fernando Castillo Placencia <[email protected]>:
> Una posible idea sería usar el Firefox con http://seleniumhq.org/
> Selenium te permite hacer rutinas para testear páginas web y obtener
> resultados.
> Tambien podrías hacer un script en Ruby que lea la página web y la
> "decodifique" según tus necesidades.
> Algo como esto:
> class LeeWeb
>     # método para conectarse al servidor
>     def self.sd_request(direccion)
>       uri = URI.parse(direccion)
>       response = Net::HTTP.start(uri.host, uri.port) do |http|
>         http.get direccion
>       end
>       return response.body
>     end
>    #rutina para obtener los datos:
>   def toma_datos
>     uri = "http://la.url.que.quieres.tomar.com";
>     p = self.sd_request(uri)
>
>     #lo convierto en un DOM
>     require 'hpricot'
>     p = Hpricot(p)
>
>     #encuentro la celda o tabla con datos, debe tener un estilo...:
>     fecha = p.search("//td/sp...@class='Texto_Tabla_BVL']")
>     #etc etc etc
>   end
> end
>
>
>
>
> El 12 de octubre de 2010 17:40, HelpDesk/Developer <[email protected]>
> escribió:
>>
>> Hola listeros,
>> Necesito que me den una senal de luz, estoy haciendo un sistema de
>> consultas de averias todo el proceso esta trabajando con normalidad, el tema
>> esta que para actualizar nuestra data con los ultimos reportes registrados,
>> nuestro cliente para el cual trabajamos nos brinda una pagina web hecho en
>> ASP y cuando requerimos actualizar, el resultados lanza 70 paginas(cada
>> pagina max muestra 30 items y lo hacen con ajax)
>> Intente modificando el HTML inLive con Firefox y WebDeveloper  pero el ASP
>> me detecta el cambio de la pagina y me generar error y me cierra la
>> session.
>> Un usuario para copiando y pegado casi toda la manana en excel, luego este
>> excel tiene una macro que carga toda la data copiada al sistema.
>> En algunas oportunidades se ha solicitado al area de sistema que nos
>> brinden la totalidad de la data, pero por cuestion de privacidad este
>> requerimiento lo deniegan y solo argumentan que en una oportundiad proxima
>> se estaria habilitando esta data via web, por politicas de ellos en fin.
>>
>> Alguien me puede dar una luz de como podría capturar los datos de estas
>> paginas, o tal vez han visto alguna utilidad para poder capturar datos, o
>> alguna idea de como poder hacerlo?
>> Gracias a todos,
>> Elias Fuentes
>> Support / Developer
>> --------------------------------
>> http://blog.miasoftware.net
>>
>>
>>
>> _______________________________________________
>> Lista de correo Linux-plug
>> Temática: Discusión general sobre Linux
>> Peruvian Linux User Group (http://www.linux.org.pe)
>>
>> Participa suscribiéndote y escribiendo a:  [email protected]
>> Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
>> http://voip2.voip.net.pe/mailman/listinfo/linux-plug
>>
>> IMPORTANTE: Reglas y recomendaciones
>> http://www.linux.org.pe/listas/reglas.php
>> http://www.linux.org.pe/listas/comportamiento.php
>> http://www.linux.org.pe/listas/recomendaciones.php
>
>
> _______________________________________________
> Lista de correo Linux-plug
> Temática: Discusión general sobre Linux
> Peruvian Linux User Group (http://www.linux.org.pe)
>
> Participa suscribiéndote y escribiendo a:  [email protected]
> Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
> http://voip2.voip.net.pe/mailman/listinfo/linux-plug
>
> IMPORTANTE: Reglas y recomendaciones
> http://www.linux.org.pe/listas/reglas.php
> http://www.linux.org.pe/listas/comportamiento.php
> http://www.linux.org.pe/listas/recomendaciones.php
>



-- 
Ing. Pedro Muñoz del Río
CIP: 105362

Acérquese a nuestra empresa: http://www.simuder.com
------------------------------------------------
APESOL: http://www.apesol.org
_______________________________________________
Lista de correo Linux-plug
Temática: Discusión general sobre Linux
Peruvian Linux User Group (http://www.linux.org.pe)

Participa suscribiéndote y escribiendo a:  [email protected]
Para darte de alta, de baja  o hacer ajustes a tu suscripción visita:
http://voip2.voip.net.pe/mailman/listinfo/linux-plug

IMPORTANTE: Reglas y recomendaciones
http://www.linux.org.pe/listas/reglas.php
http://www.linux.org.pe/listas/comportamiento.php
http://www.linux.org.pe/listas/recomendaciones.php

Responder a