Re: html -> pdf
On 2016-06-30, Alex Kicelew wrote: > Да, в итоге так и сделал. Просто было лень писать парсер, была надежда, > что такая задача уже перед кем-нибудь вставала. :) Я хотел читать HTML книжки в Kindle и Calibre обладает соответсвующим инструментом: http://ebooks.stackexchange.com/questions/2/how-can-i-convert-an-html-site-into-an-ebook/6285#6285 $ wget -r -np -nc -k -c http://.../.../.. Locate your main HTML file (usually book.html or index.html) and convert to MOBI: $ cd dir-with-index $ ebook-convert index.html book.mobi $ ebook-convert index.html book.fb2 $ ebook-convert index.html book.epub С PDF тоже работает: $ ebook-convert index.html book.pdf Читать можно но Calibre убирает форматирование, работатет как скринридер или как оно называется (отображение текста в формате для тех кого disabilities). В личку копию что бы точно дошло. -- http://defun.work/
Re: html -> pdf
В Thu, 30 Jun 2016 13:56:33 +0300 Alex Kicelewпишет: > On 06/30/16 12:57, Sergey Korobitsin wrote: > > "В глубину" - это как если у вас есть оглавление и > > генератор по нему ходил, собирая html-ки в указанном > > порядке? Такое, по-моему, проще самому наколбасить, > > распарсив html-ку и получив список файлов в нужном > > порядке. > > Да, в итоге так и сделал. Просто было лень писать парсер, > была надежда, что такая задача уже перед кем-нибудь > вставала. :) > Парсер можно готовый взять, например, hxwls из html-xml-utils.
Re: html -> pdf
Alex Kicelew ☫ → To debian-russian@lists.debian.org @ Wed, Jun 29, 2016 22:42 +0300 > Hi. > > А есть ли в дебиане конвертор класса "сабж", не просто умеющий сгенерить > один пдф из кучи хтмлек (это умеет и htmldoc), а еще и сам выстраивающий > эти хтмльки в порядке обхода в глубину, если указать ему головной файл? "В глубину" - это как если у вас есть оглавление и генератор по нему ходил, собирая html-ки в указанном порядке? Такое, по-моему, проще самому наколбасить, распарсив html-ку и получив список файлов в нужном порядке. > Вот этой фичи в htmldoc я не нашел, он располагает хтмльки в порядке > перечисления в командной строке (в алфавитном, если задать *.html). > -- Bright regards, Sergey Korobitsin, Chief Research Officer Arta Software, http://arta.kz/ xmpp:underta...@jabber.arta.kz -- Пифагоровы штаны Лобачевскому смешны --
html -> pdf
Hi. А есть ли в дебиане конвертор класса "сабж", не просто умеющий сгенерить один пдф из кучи хтмлек (это умеет и htmldoc), а еще и сам выстраивающий эти хтмльки в порядке обхода в глубину, если указать ему головной файл? Вот этой фичи в htmldoc я не нашел, он располагает хтмльки в порядке перечисления в командной строке (в алфавитном, если задать *.html).