Re: [Madrid-pm] Eliminar las stopwords de un texto

Ruben Espadas Vargas Mon, 29 Mar 2010 02:23:12 -0700

Buenos días,

Para mi la forma que dice Salvador seria de las mas correctas, ya que si
lo que quieres mantener es la estructura y cada registro es una linea en
el fichero deberias de leer el fichero linea a linea e ir eliminando de
cada una lo que quieras, en este caso las stopwords.


Saludos

El 29/03/2010 11:17, Salvador Fandino escribió:
>
>
>
> ----- Original Message ----
>   
>> From: PEGG <[email protected]>
>> To: Lista de correo de Madrid Perl Mongers <[email protected]>
>> Sent: Mon, March 29, 2010 11:10:09 AM
>> Subject: Re: [Madrid-pm] Eliminar las stopwords de un texto
>>
>> Gracias, pero con esa forma pierdo la estructura de registro, en
>>     
> teoría cada 
>   
>> registro está separado por un salto de linea. Aunque he
>>     
> visto algunos 
>   
>> registros que dentro tienen varios saltos de lineas, por
>>     
> eso digo en teoria, 
>   
>> jajajaja. Esto me tiene loco, 
>> jajajaja,
>>     
> que tal asi:
>
>   use Lingua::EN::StopWords qw(%StopWords);
>   
> open(TEXTO,"contenido.txt");
>
>   while (<TEXTO>) {
>     my @words = grep !$StopWords{$_}, /\w+/g;
>     print "@words\n";
>   }
>
> De todas formas, todo dependera de lo que quieras obtener. Antes de ponerte a 
> escribir nada en Perl deberias de pararte a pensar como son tus datos de 
> entrada y en que los quieres transformar.
>
> - Salva
> _______________________________________________
> Madrid-pm mailing list
> [email protected]
> http://mail.pm.org/mailman/listinfo/madrid-pm
>   

_______________________________________________
Madrid-pm mailing list
[email protected]
http://mail.pm.org/mailman/listinfo/madrid-pm

Re: [Madrid-pm] Eliminar las stopwords de un texto

Responder a