Stain, então já da uma dica do Text::CSV_XS Deixa o Spreadsheet::ParseExcel e o Spreadsheet::XLSX, pois geralmente não há muito material sobre como ler o XLSX (o SimpleXLSX é lento demais)
Estou escrevendo o artigo do PDF, porém, estou usando um PDF de exemplo do INPA (LI<https://www.google.com/history/url?url=http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf&ei=tn5iTbv6MZvvoAfXl4SEBA&sig2=4uCo1cQ1t7TkJ7r5BnZ8uA&ct=w>STA TELEFÔNICA DO INPA 2009/2010<https://www.google.com/history/url?url=http://www.inpa.gov.br/internas/coad/lista_telefonica_2009-2010-2.pdf&ei=tn5iTbv6MZvvoAfXl4SEBA&sig2=4uCo1cQ1t7TkJ7r5BnZ8uA&ct=w> http://goo.gl/1rrEL ), e talvez tenha algum PDF melhor que o Thiago citou na campus party, assim já entra mais ainda no tema de OpenData 2011/2/21 Stanislaw Pusep <[email protected]> > Deixa o Text::CSV comigo ;) > > ABS() > > > > 2011/2/21 Lindolfo Lorn Rodrigues <[email protected]> > > Ei, eu já tinha me comprometido com um artigo comparando o Curl , LWP e >> Mechanize. >> Não sei porque não tá na lista :) >> >> 2011/2/21 Thiago Rondon <[email protected]> >> >> >>> Olá Pessoal, >>> >>> Daqui 8 dias começa o nosso evento equinócio, que tem como principal >>> proposta gerar conteúdo na lingua portuguesa sobre a linguagem Perl. >>> >>> E eu estou sentindo a falta de alguns artigos, como por exemplo REGEX. >>> Falar sobre extração de dados, arquivos e não termos nenhum artigo sobre a >>> pcre esta me soando estranho ! Não temos nenhum voluntário para isto ? Isto >>> é uma das nossas ferramentas mais usadas, não só na linguagem Perl, como em >>> vários outras que suportam a pcre, ou seja este artigo pode ser uma >>> referencia para vários programadores de diversas linguagens. >>> >>> Outro artigo que estou sentindo falta é do Text::CSV, muitos dados >>> públicos estão sendo distribuídos através deste formato, e não há muito >>> mistério para efetuar uma abordagem em relação a ele. >>> >>> Infelizmente o governo divulga dados em Excel também, e existe um módulo >>> muito interessante em Perl que talvez alguns da lista já tenham experiência, >>> como o Spreadsheet::ParseExcel[::Simple]. >>> >>> Nós temos mais de uma maneira de buscar dados, como por exemplo com lwp, >>> mecanize e Curl (né Lorn ?) :) Seria interessante abordar estas ferramentas >>> de maneira geral e explicar o objetivo de cada um deles, e qual o nicho de >>> utilização deles. >>> >>> Uma outra abordagem interessante, é que muita gente quer escrever >>> "scripts" para enviar informações para redes sociais, como o twitter ou >>> mesmo por RSS e o nosso repositório esta farto de módulos como este. >>> >>> Ah! E sobre XPATH ? Esta linguagem tem uma abordagem simples, porém muito >>> útil e que facilita a vida de muitos desenvolvedores que irão buscar dados >>> em sites que não sabem ainda o que são formatos abertos. Existe muitos >>> módulos no CPAN sobre XPATH, uns para casos simples e outros para casos mais >>> avançados, seria interessante abordar qualquer um deles. >>> >>> Além de sentir a falta de alguns artigos, estou sentindo a falta da >>> colaboração de algumas pessoas da lista. :-) >>> >>> Eu tomei a liberdade de enviar este e-mail conversando com o Marcio >>> Ferreira, e ele me passou a lista de pessoas que estão confirmadas para >>> escrever: >>> >>> - Por que Perl ? - Breno (Garu) >>> - Introdução ao Open-Data - Thiago Rondon (Maluco) >>> - Open-Data BR - Alexei (Russoz) >>> - Extraindo informação de PDF - Renato Santos (Cron) >>> - Comparaçao de Strings - Wesley Blabos >>> - XML Schema - Eden Cardin >>> - Mongoose (MongoDB + Moose) - Solli Honório >>> - KinoSearch (Search Engine) - Marcio Ferreira >>> - Perl e Unicode (entre outras codificações de texto) - Stanislaw Pusep >>> - Extração de dados com xpath e regex Exportando em ODF - Millen >>> (extreme) >>> - Scraping web com Perl - Marcio Ferreira >>> - HTTPS - Gabriel Andrade >>> - Divertindo-se com Daemons - Daniel Mantovani. >>> - Distribuindo com RDF e encontrando com o SPARQL - Thiago Rondon. >>> >>> Abs! >>> -Thiago Rondon >>> >>> >>> =begin disclaimer >>> Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ >>> SaoPaulo-pm mailing list: [email protected] >>> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> >>> =end disclaimer >>> >> >> >> >> -- >> lorn at lornlab dot org >> Lindolfo "Lorn" Rodrigues >> >> >> =begin disclaimer >> Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ >> SaoPaulo-pm mailing list: [email protected] >> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> >> =end disclaimer >> >> > > =begin disclaimer > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ > SaoPaulo-pm mailing list: [email protected] > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > =end disclaimer > > -- Renato Santos http://www.renatocron.com/blog/
=begin disclaimer Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm mailing list: [email protected] L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> =end disclaimer
