Estimado Sergio Castro Su punto se encuentra muy próximo, table[@class='points']/tr, usted obtiene los tr de la tabla, pero en realidad no desea estos, sino algo como /tr/td, o class “semana” … Tendría que poder recorrer el DOM para estar seguro pero con unos pequeños cambios estaría la solución.
Javier Rubén Marcuzzi De: Sergio Castro Enviado: lunes, 18 de enero de 2016 13:29 Para: r-help-es Asunto: [R-es] Extraccion de datos de una Web Buenas tardes, Quiero extraer datos de una web en la que ser relaciona la semana con la puntuación obtenida por un jugador. Ahora mismo llego a obtener elnodo en el que se relacionan la semana con la puntuación obtenida, pero no soy capaz de extraer esa informacion en una tabla de dos columna (semana, puntuacion) teniendo en cuenta que puede que haya semanas que no haya puntuado (en el ejemplo, la segunda semana). De momento lo estoy obteniendo de la siguiente forma: url_jugador<-"http://localhost:8080/jugadores/Luis" txt_jugador <- getURL(url_jugador) doc<-htmlTreeParse(txt_jugador, useInternalNodes = TRUE) puntos_nodo<- xpathApply(doc, "//") puntos_nodo [[1]] <tr> <td class="semana">1</td> <td class="neg"/> <td> <div class="bar">6</div> </td> </tr> [[2]] <tr> <td class="semana">2</td> <td class="neg"/> <td/> </tr> [[3]] <tr> <td class="semana">3</td> <td class="neg"/> <td> <div class="bar">9</div> </td> </tr> attr(,"class") [1] "XMLNodeSet" ¿Veis alguna forma de sacar la información que necesito? Muchas gracias. Un saludo. _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es