Oi mop, obrigado pelo apoio. Existe uma diferença nada sutil entra os RSS e a página de notícias: vários dias de atraso !!! (pelo menos na Globo)
Consegui uma solução que carrega a página de Ciencias e todas as páginas das notícias correspondentes. Está bom, uso o wget e limpo depois. Como quero fazer isso com vários sites, preciso de arquivo de configuração. Por incrível que paressa *essa* é a parte mais difícil... ainda estou aceitando sugestões, fiz uma que acho meio estranha :( Alain mop escreveu: > Considerando que minha bola não foi muito fora, me atrevo a dizer que > talvez haja um lugar melhor para você pegar a informação desejada. > > Normalmente páginas de notícias têm links para news feeder correspondente, > identificados como rss, xml, etc. Embora haja algumas diferenças sutis entre > formatos, um único script poderá tratar todos. Bastará você passar um > único parâmetro, o endereço do feeder. Além disso, por ser algo padronizado, > não depende da fonte.
