então acho mais fácil tentar converter o PDF para texto e depois encontrar o padrão nesse texto e montar o PDF.
Ferramentas: http://linux.die.net/man/1/pdftotext ainda não cheguei a usar o *PDF::OCR2<http://search.cpan.org/~leocharre/PDF-OCR2-1.21/lib/PDF/OCR2.pod>, mas pode ser util pra você* para escrever o PDF, tem o *Spreadsheet::Write*<http://search.cpan.org/~amaltsev/Spreadsheet-Write-0.03/lib/Spreadsheet/Write.pm> 2012/6/1 Juliano Silva <[email protected]> > Olá Daniel, > > É uma conta telefônica de celular. > O projeto é converter os arquivos que veem em PDF para Excel, para que o > setor financeiro possa cobrar dos usuários as chamadas que não são > corporativas. > > > Juliano Dantas Almeida Silva > Consórcio Metroman > > -----Mensagem original----- > De: [email protected] > [mailto:[email protected]] Em nome de > [email protected] > Enviada em: sexta-feira, 1 de junho de 2012 11:22 > Para: [email protected] > Assunto: SaoPaulo-pm Digest, Vol 93, Issue 2 > > Send SaoPaulo-pm mailing list submissions to > [email protected] > > To subscribe or unsubscribe via the World Wide Web, visit > http://mail.pm.org/mailman/listinfo/saopaulo-pm > or, via email, send a message with subject or body 'help' to > [email protected] > > You can reach the person managing the list at > [email protected] > > When replying, please edit your Subject line so it is more specific than > "Re: Contents of SaoPaulo-pm digest..." > > > Today's Topics: > > 1. RES: SaoPaulo-pm Digest, Vol 93, Issue 1 (Juliano Silva) > 2. Re: modulo perl para convers?o de PDF para Excel > (Daniel Vinciguerra) > 3. Re: modulo perl para convers?o de PDF para Excel > (Daniel Vinciguerra) > > > ---------------------------------------------------------------------- > > Message: 1 > Date: Fri, 1 Jun 2012 10:20:16 -0300 > From: "Juliano Silva" <[email protected]> > To: <[email protected]> > Subject: [SP-pm] RES: SaoPaulo-pm Digest, Vol 93, Issue 1 > Message-ID: <[email protected]> > Content-Type: text/plain; charset="iso-8859-1" > > Obrigado pela informa??o. Eu j? consigo converter para TXT. > > > Juliano Dantas Almeida Silva > Cons?rcio Metroman > > -----Mensagem original----- > De: [email protected] > [mailto:[email protected]] Em nome de > [email protected] Enviada em: sexta-feira, 1 de junho de 2012 > 10:06 > Para: [email protected] > Assunto: SaoPaulo-pm Digest, Vol 93, Issue 1 > > Send SaoPaulo-pm mailing list submissions to > [email protected] > > To subscribe or unsubscribe via the World Wide Web, visit > http://mail.pm.org/mailman/listinfo/saopaulo-pm > or, via email, send a message with subject or body 'help' to > [email protected] > > You can reach the person managing the list at > [email protected] > > When replying, please edit your Subject line so it is more specific than > "Re: Contents of SaoPaulo-pm digest..." > > > Today's Topics: > > 1. Re: [Rio-pm] vari?vel $^H no Perl 5.16 (Stanislaw Pusep) > 2. modulo perl para convers?o de PDF para Excel (Juliano Silva) > 3. Re: modulo perl para convers?o de PDF para Excel (Renato Santos) > 4. Re: modulo perl para convers?o de PDF para Excel (Renato Santos) > > > ---------------------------------------------------------------------- > > Message: 1 > Date: Thu, 31 May 2012 16:03:43 -0300 > From: Stanislaw Pusep <[email protected]> > To: Perl Mongers Rio de Janeiro <[email protected]> > Cc: [email protected] > Subject: Re: [SP-pm] [Rio-pm] vari?vel $^H no Perl 5.16 > Message-ID: > <cangjoaa3rc6mqhcfljkzkjapstvh37ktgxh4iwtovz6z1ex...@mail.gmail.com > > > Content-Type: text/plain; charset="utf-8" > > Pelo que consegui entender at? agora, o arquivo respons?vel pelo pragma > "feature" n?o ? mais mantido manualmente; tem um script que o faz > "automagicamente": > > $ head ~/perl5/perlbrew/build/perl-5.16.0/regen/feature.pl > #!/usr/bin/perl > # > # Regenerate (overwriting only if changed): > # > # lib/feature.pm > # feature.h > # > # from information hardcoded into this script and from two #defines # in > perl.h. > # > > ABS() > > > > On Thu, May 31, 2012 at 11:30 AM, Fernando Oliveira < > [email protected]> wrote: > > > eu tb n?o sei, mas deve ter algo com isso: > > http://search.cpan.org/dist/perl-5.16.0/pod/perldelta.pod#use_VERSION > > > > > > > > Just another Perl Hacker, > > Fernando (SmokeMachine) > > > > > > Em 31 de maio de 2012 11:09, Stanislaw Pusep > <[email protected]>escreveu: > > > >> 0x1c000000 > > > > > > > > _______________________________________________ > > Rio-pm mailing list > > [email protected] > > http://mail.pm.org/mailman/listinfo/rio-pm > > > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120531/6c9f7e29/atta > chment-0001.html> > > ------------------------------ > > Message: 2 > Date: Fri, 1 Jun 2012 10:03:25 -0300 > From: "Juliano Silva" <[email protected]> > To: <[email protected]>, <[email protected]> > Subject: [SP-pm] modulo perl para convers?o de PDF para Excel > Message-ID: <[email protected]> > Content-Type: text/plain; charset="iso-8859-1" > > Bom dia a todos !!! > > > > Algu?m pode informar se existe algum m?dulo que converte PDF para Excel ou > se algu?m j? desenvolveu algo para esse fim? > > > > Grato, > > > > METROM~1 > > Juliano Dantas Almeida Silva > > Cons?rcio Metroman > > > > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/f31939f0/atta > chment-0001.html> > -------------- next part -------------- > A non-text attachment was scrubbed... > Name: not available > Type: image/jpeg > Size: 2284 bytes > Desc: not available > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/f31939f0/atta > chment-0001.jpe> > > ------------------------------ > > Message: 3 > Date: Fri, 1 Jun 2012 10:05:56 -0300 > From: Renato Santos <[email protected]> > To: [email protected] > Cc: [email protected], [email protected] > Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel > Message-ID: > <cabmdq_tf9ztoc8qu4ecptzbfduhdz8fs8po0saehsjdhgoq...@mail.gmail.com > > > Content-Type: text/plain; charset="iso-8859-1" > > Cara, > > Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for inteiro > apenas uma imagem. > > E deposi de converter em textos, vc precisa "entender" o texto (via > posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que vc > precisa. > > > Acho que isso que voc? quer n?o existe! > > Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter? > que ler o PDF letra por letra e montar uma matrix virtual de onde ficaria > cada letra) do "como abro essa imagem no word?" > > 2012/6/1 Juliano Silva <[email protected]> > > > Bom dia a todos !!!**** > > > > ** ** > > > > Algu?m pode informar se existe algum m?dulo que converte PDF para > > Excel ou se algu?m j? desenvolveu algo para esse fim?**** > > > > ** ** > > > > Grato,**** > > > > ** ** > > > > [image: METROM~1]**** > > > > *Juliano Dantas Almeida Silva* > > > > *Cons?rcio Metroman* > > > > ** ** > > > > =begin disclaimer > > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm > > mailing list: [email protected] > > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > > =end disclaimer > > > > > > > -- > Sarav?, > Renato CRON > http://www.renatocron.com/blog/ > @renato_cron <http://twitter.com/#!/renato_cron> > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/b4c8c22d/atta > chment-0001.html> > > ------------------------------ > > Message: 4 > Date: Fri, 1 Jun 2012 10:05:56 -0300 > From: Renato Santos <[email protected]> > To: [email protected] > Cc: [email protected], [email protected] > Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel > Message-ID: > <cabmdq_tf9ztoc8qu4ecptzbfduhdz8fs8po0saehsjdhgoq...@mail.gmail.com > > > Content-Type: text/plain; charset="iso-8859-1" > > Cara, > > Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for inteiro > apenas uma imagem. > > E deposi de converter em textos, vc precisa "entender" o texto (via > posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que vc > precisa. > > > Acho que isso que voc? quer n?o existe! > > Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter? > que ler o PDF letra por letra e montar uma matrix virtual de onde ficaria > cada letra) do "como abro essa imagem no word?" > > 2012/6/1 Juliano Silva <[email protected]> > > > Bom dia a todos !!!**** > > > > ** ** > > > > Algu?m pode informar se existe algum m?dulo que converte PDF para > > Excel ou se algu?m j? desenvolveu algo para esse fim?**** > > > > ** ** > > > > Grato,**** > > > > ** ** > > > > [image: METROM~1]**** > > > > *Juliano Dantas Almeida Silva* > > > > *Cons?rcio Metroman* > > > > ** ** > > > > =begin disclaimer > > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm > > mailing list: [email protected] > > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > > =end disclaimer > > > > > > > -- > Sarav?, > Renato CRON > http://www.renatocron.com/blog/ > @renato_cron <http://twitter.com/#!/renato_cron> > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/b4c8c22d/atta > chment-0002.html> > > ------------------------------ > > _______________________________________________ > SaoPaulo-pm mailing list > [email protected] > http://mail.pm.org/mailman/listinfo/saopaulo-pm > > End of SaoPaulo-pm Digest, Vol 93, Issue 1 > ****************************************** > > > > ------------------------------ > > Message: 2 > Date: Fri, 1 Jun 2012 11:21:03 -0300 > From: Daniel Vinciguerra <[email protected]> > To: [email protected] > Cc: [email protected], [email protected] > Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel > Message-ID: > <CADoJa-Gkj2uyhF=vwk-MRb8UXhZCK_2=648ssy4b59_vjx0...@mail.gmail.com > > > Content-Type: text/plain; charset="iso-8859-1" > > Voc? poderia nos dizer ou mostrar (caso a coisa seja feia), para nos poupar > o trabalho de ficar imaginando qual a cara do seu PDF. > > Caso seja uma imagem, a coisa realmente vai ficar complicada... mas se ja > tiver uma "carinha" de tabela eu acho que ? mais simples e possivel que o > anterior. > > []'s > * > Daniel Vinciguerra* > Web Solutions Architect and Co-Owner at Bivee > http://github.com/dvinciguerra > <http://github.com/dvinciguerra> > > > 2012/6/1 Renato Santos <[email protected]> > > > Cara, > > > > Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for > > inteiro apenas uma imagem. > > > > E deposi de converter em textos, vc precisa "entender" o texto (via > > posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que > > vc precisa. > > > > > > Acho que isso que voc? quer n?o existe! > > > > Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter? > > que ler o PDF letra por letra e montar uma matrix virtual de onde > > ficaria cada letra) do "como abro essa imagem no word?" > > > > 2012/6/1 Juliano Silva <[email protected]> > > > >> Bom dia a todos !!!**** > >> > >> ** ** > >> > >> Algu?m pode informar se existe algum m?dulo que converte PDF para > >> Excel ou se algu?m j? desenvolveu algo para esse fim?**** > >> > >> ** ** > >> > >> Grato,**** > >> > >> ** ** > >> > >> [image: METROM~1]**** > >> > >> *Juliano Dantas Almeida Silva* > >> > >> *Cons?rcio Metroman* > >> > >> ** ** > >> > >> =begin disclaimer > >> Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm > >> mailing list: [email protected] > >> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > >> =end disclaimer > >> > >> > > > > > > -- > > Sarav?, > > Renato CRON > > http://www.renatocron.com/blog/ > > @renato_cron <http://twitter.com/#!/renato_cron> > > > > > > =begin disclaimer > > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm > > mailing list: [email protected] > > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > > =end disclaimer > > > > > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/5cccba23/atta > chment-0001.html> > > ------------------------------ > > Message: 3 > Date: Fri, 1 Jun 2012 11:21:03 -0300 > From: Daniel Vinciguerra <[email protected]> > To: [email protected] > Cc: [email protected], [email protected] > Subject: Re: [SP-pm] modulo perl para convers?o de PDF para Excel > Message-ID: > <CADoJa-Gkj2uyhF=vwk-MRb8UXhZCK_2=648ssy4b59_vjx0...@mail.gmail.com > > > Content-Type: text/plain; charset="iso-8859-1" > > Voc? poderia nos dizer ou mostrar (caso a coisa seja feia), para nos poupar > o trabalho de ficar imaginando qual a cara do seu PDF. > > Caso seja uma imagem, a coisa realmente vai ficar complicada... mas se ja > tiver uma "carinha" de tabela eu acho que ? mais simples e possivel que o > anterior. > > []'s > * > Daniel Vinciguerra* > Web Solutions Architect and Co-Owner at Bivee > http://github.com/dvinciguerra > <http://github.com/dvinciguerra> > > > 2012/6/1 Renato Santos <[email protected]> > > > Cara, > > > > Voc? ter? que converter o PDF para texto, isso ?, se o PDF n?o for > > inteiro apenas uma imagem. > > > > E deposi de converter em textos, vc precisa "entender" o texto (via > > posi??es, sei l?, deus te ajude) e escrever no seu Excel do jeito que > > vc precisa. > > > > > > Acho que isso que voc? quer n?o existe! > > > > Esta quase no mesmo n?vel de "impossible" (exceto se for texto, voc? ter? > > que ler o PDF letra por letra e montar uma matrix virtual de onde > > ficaria cada letra) do "como abro essa imagem no word?" > > > > 2012/6/1 Juliano Silva <[email protected]> > > > >> Bom dia a todos !!!**** > >> > >> ** ** > >> > >> Algu?m pode informar se existe algum m?dulo que converte PDF para > >> Excel ou se algu?m j? desenvolveu algo para esse fim?**** > >> > >> ** ** > >> > >> Grato,**** > >> > >> ** ** > >> > >> [image: METROM~1]**** > >> > >> *Juliano Dantas Almeida Silva* > >> > >> *Cons?rcio Metroman* > >> > >> ** ** > >> > >> =begin disclaimer > >> Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm > >> mailing list: [email protected] > >> L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > >> =end disclaimer > >> > >> > > > > > > -- > > Sarav?, > > Renato CRON > > http://www.renatocron.com/blog/ > > @renato_cron <http://twitter.com/#!/renato_cron> > > > > > > =begin disclaimer > > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm > > mailing list: [email protected] > > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > > =end disclaimer > > > > > -------------- next part -------------- > An HTML attachment was scrubbed... > URL: > < > http://mail.pm.org/pipermail/saopaulo-pm/attachments/20120601/5cccba23/atta > chment-0002.html> > > ------------------------------ > > _______________________________________________ > SaoPaulo-pm mailing list > [email protected] > http://mail.pm.org/mailman/listinfo/saopaulo-pm > > End of SaoPaulo-pm Digest, Vol 93, Issue 2 > ****************************************** > > =begin disclaimer > Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ > SaoPaulo-pm mailing list: [email protected] > L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> > =end disclaimer > -- Saravá, Renato CRON http://www.renatocron.com/blog/ @renato_cron <http://twitter.com/#!/renato_cron>
=begin disclaimer Sao Paulo Perl Mongers: http://sao-paulo.pm.org/ SaoPaulo-pm mailing list: [email protected] L<http://mail.pm.org/mailman/listinfo/saopaulo-pm> =end disclaimer
