Задача в том, чтобы получить текст этой страницы PDF <https://yadi.sk/i/3bT0EOEIdSeUp>. И проблема именно в кодировках в Perl. из my $pdf = CAM::PDF->new($file_name); my $text = $pdf->getPageText(1); приезжает скаляр, который не получается заэнкодить в utf8.
16 декабря 2014 г., 22:29 пользователь Nikolay Mishin <[email protected]> написал: > > Иван, может дашь этот pdf, самому попробовать и расскажешь задачу? > Я пока не очень понимаю, что нужно > > 16.12.2014, 19:43, "Харпалёв Иван" <[email protected]>: > > А что значит "неведомо в какой кодировке"? > > Ведь у Perl вроде может быть только информация utf8 или нет. О других > > кодировках вроде же нигде не хранится инфа.. или хранится? > > > > 8 декабря 2014 г., 21:44 пользователь Алексей Мышкин > > <[email protected]> написал: > >> Эта строка мало что без флага, так и ещё в какой-то неведомой > кодировке, > >> иначе линукс консоль отображала бы её в читабельном виде. > >> > >> 08 дек. 2014 г. 22:41 пользователь "Харпалёв Иван" > >> <[email protected]> написал: > >>> Есть строка, без флага utf8. > >>> Utf8-консоль отображает строку зюками. > >>> decode("Detect", $data); не угадывает. > >>> > >>> Как правильно перевести в utf8? > >>> > >>> Где взять массив всех возможных ENCODING, чтобы переводить из них в > utf8 и > >>> смотреть, угадали или нет? > >>> в pod Encode::Supported как получить массив не вижу. > >>> > >>> Вроде насущна проблема, > >>> как такое делать? > >>> > >>> Спасибо! > >>> > >>> -- > >>> Moscow.pm mailing list > >>> [email protected] | http://moscow.pm.org > >> -- > >> Moscow.pm mailing list > >> [email protected] | http://moscow.pm.org > > > > -- > > Moscow.pm mailing list > > [email protected] | http://moscow.pm.org > > -- > С уважением > Николай Мишин > > -- > Moscow.pm mailing list > [email protected] | http://moscow.pm.org >
-- Moscow.pm mailing list [email protected] | http://moscow.pm.org
