Oi

Em 25 de junho de 2013 08:23, Ricardo Jorge <[email protected]> escreveu:

> Olá a todos
> Estou precisando baixar por lote os artigos de texto de um site.
>
> Estou usando o comando wget -r
> http://www.endereço_do_site <http://www.xn--endereo_do_site-jmb><
> http://www.xn--endereo_do_site-jmb>- para
> baixar todo o site
>
> Há vários sites tutores para o wget, como o:
> http://www.hardware.com.br/dicas/baixando-sites-wget.html
>
> Mas gostaria de baixar somente as partes dos texto de artigo de um blog.
>
> Existe alguma alternativa de comandos do wget para baixar texto.
>

vê se cola:

$ sudo apt-get install html2text

$ wget -r site | html2text -o site.txt

more options:

$ man html2text

chau!

André Cavalcante
Manaus, AM., Brasil

Ubuntu User number # 24370
Quer saber sobre Open Source Software? http://sobreoss.blogspot.com
Quer saber mais sobre Espiritismo? http://sobreespiritismo.blogspot.com

Atenção: Este e-mail pode conter anexos no formato ODF (Open Document
Format)/ABNT (extensões odt, ods, odp, odb, odg). Antes de pedir os anexos
em outro formato, você pode instalar gratuita e livremente o LibreOffice (
http://pt-br.libreoffice.org/).
-- 
Mais sobre o Ubuntu em português: http://www.ubuntu-br.org/comece

Lista de discussão Ubuntu Brasil
Histórico, descadastramento e outras opções:
https://lists.ubuntu.com/mailman/listinfo/ubuntu-br

Responder a