----- Original Message ----
> From: PEGG <[email protected]>
> To: Lista de correo de Madrid Perl Mongers <[email protected]>
> Sent: Mon, March 29, 2010 11:10:09 AM
> Subject: Re: [Madrid-pm] Eliminar las stopwords de un texto
>
> Gracias, pero con esa forma pierdo la estructura de registro, en
teoría cada
> registro está separado por un salto de linea. Aunque he
visto algunos
> registros que dentro tienen varios saltos de lineas, por
eso digo en teoria,
> jajajaja. Esto me tiene loco,
> jajajaja,
que tal asi:
use Lingua::EN::StopWords qw(%StopWords);
open(TEXTO,"contenido.txt");
while (<TEXTO>) {
my @words = grep !$StopWords{$_}, /\w+/g;
print "@words\n";
}
De todas formas, todo dependera de lo que quieras obtener. Antes de ponerte a
escribir nada en Perl deberias de pararte a pensar como son tus datos de
entrada y en que los quieres transformar.
- Salva
_______________________________________________
Madrid-pm mailing list
[email protected]
http://mail.pm.org/mailman/listinfo/madrid-pm