Em 22 de maio de 2013 10:30, Nelson Luiz Gonzaga <[email protected]>escreveu:

> Em 22 de maio de 2013 10:15, Marcos Aurelio Nobre 
> <[email protected]>escreveu:
>
> Acho que esse é o tipo de "operação" que seria melhor desempenhado no
>> servidor de Aplicação.
>>
>>
>>
>>
>> Em 22 de maio de 2013 09:59, Nelson Luiz Gonzaga 
>> <[email protected]>escreveu:
>>
>>> Ola lista,
>>> Existe no PostgreSQL (ou alguem ja desenvolveu) alguma funcao que
>>> converte html para texto puro?
>>>
>>> A ideia eh esconder as tags do html e mostrar o resultado sem formatacao
>>> mesmo num grid.
>>>
>>> Valeu,
>>> Nelson
>>>
>>>
>>> _______________________________________________
>>> pgbr-geral mailing list
>>> [email protected]
>>> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
>>>
>>>
>>
>> _______________________________________________
>> pgbr-geral mailing list
>> [email protected]
>> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
>>
>>
> Pois é Marcos Aurelio,
> No .net tem a funcao .Document.body.innerText que pega apenas o texto do
> objeto WebBrowser.
> Mas o meu problema é que eu ligo o retorno do select direto no grid, e nao
> tem como passar pela funcao acima a nao ser fazer 'na mao' o preenchimento
> do grid.
>
> Vou tentar fazer uma funcao no postgresql usando replace, trim, substr,
> split ...
> Se eu procurar por '<' ate '>' e jogar tudo dentro disso fora, consigo o
> resultado esperado.
>
>  ex.:
> <html><body><p><strong>Sr(s),</strong><br>Foi APROVADO ORDEM DE SERVICO
> :<br>Titulo: TESTE<br></p><p>Atenciosamente,<br>NELSON
> G.</p><p><br>[4/11/2013 1:43:16 PM]</p><p>&nbsp;</p></body></html>
>
> Vira isso:
> Sr(s),Foi APROVADO ORDEM DE SERVICO :Titulo: TESTEAtenciosamente,NELSON
> G.[4/11/2013 1:43:16 PM]
>
> []s,
> Nelson
>
>
>
> _______________________________________________
> pgbr-geral mailing list
> [email protected]
> https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
>
>

Bom dia
segue abaixo, vc precisa ter o modulo perl instalado

CREATE FUNCTION extract_contents_from_html(text) returns text AS $
  use HTML::TreeBuilder;
  use HTML::FormatText;
  my $tree = HTML::TreeBuilder->new;
  $tree->parse_content(shift);
  my $formatter = HTML::FormatText->new(leftmargin=>0, rightmargin=>78);
  $text = $formatter->format($tree);
$ LANGUAGE plperlu;

Demo:

select extract_contents_from_html('<html><body color="white">Hi
there!<br>How are you?</body></html>') ;

Output:

     extract_contents_from_html
    ----------------------------
     Hi there!
     How are you?



Nao testei para ver se funciona..

--

Douglas Fabiano Specht
_______________________________________________
pgbr-geral mailing list
[email protected]
https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral

Responder a