Buenos días, Para mi la forma que dice Salvador seria de las mas correctas, ya que si lo que quieres mantener es la estructura y cada registro es una linea en el fichero deberias de leer el fichero linea a linea e ir eliminando de cada una lo que quieras, en este caso las stopwords.
Saludos El 29/03/2010 11:17, Salvador Fandino escribió: > > > > ----- Original Message ---- > >> From: PEGG <[email protected]> >> To: Lista de correo de Madrid Perl Mongers <[email protected]> >> Sent: Mon, March 29, 2010 11:10:09 AM >> Subject: Re: [Madrid-pm] Eliminar las stopwords de un texto >> >> Gracias, pero con esa forma pierdo la estructura de registro, en >> > teoría cada > >> registro está separado por un salto de linea. Aunque he >> > visto algunos > >> registros que dentro tienen varios saltos de lineas, por >> > eso digo en teoria, > >> jajajaja. Esto me tiene loco, >> jajajaja, >> > que tal asi: > > use Lingua::EN::StopWords qw(%StopWords); > > open(TEXTO,"contenido.txt"); > > while (<TEXTO>) { > my @words = grep !$StopWords{$_}, /\w+/g; > print "@words\n"; > } > > De todas formas, todo dependera de lo que quieras obtener. Antes de ponerte a > escribir nada en Perl deberias de pararte a pensar como son tus datos de > entrada y en que los quieres transformar. > > - Salva > _______________________________________________ > Madrid-pm mailing list > [email protected] > http://mail.pm.org/mailman/listinfo/madrid-pm > _______________________________________________ Madrid-pm mailing list [email protected] http://mail.pm.org/mailman/listinfo/madrid-pm
