Re: html -> pdf

2016-07-10 Пенетрантность Oleksandr Gavenko
On 2016-06-30, Alex Kicelew wrote:

> Да, в итоге так и сделал. Просто было лень писать парсер, была надежда,
> что такая задача уже перед кем-нибудь вставала. :)

Я хотел читать HTML книжки в Kindle и Calibre обладает соответсвующим
инструментом:

http://ebooks.stackexchange.com/questions/2/how-can-i-convert-an-html-site-into-an-ebook/6285#6285

  $ wget -r -np -nc -k -c http://.../.../..

  Locate your main HTML file (usually book.html or index.html) and convert to 
MOBI:

  $ cd dir-with-index
  $ ebook-convert index.html book.mobi
  $ ebook-convert index.html book.fb2
  $ ebook-convert index.html book.epub

С PDF тоже работает:

  $ ebook-convert index.html book.pdf

Читать можно но Calibre убирает форматирование, работатет как скринридер или
как оно называется (отображение текста в формате для тех кого disabilities).

В личку копию что бы точно дошло.

-- 
http://defun.work/



Re: html -> pdf

2016-06-30 Пенетрантность Илья
В Thu, 30 Jun 2016 13:56:33 +0300
Alex Kicelew  пишет:

> On 06/30/16 12:57, Sergey Korobitsin wrote:
> > "В глубину" - это как если у вас есть оглавление и
> > генератор по нему ходил, собирая html-ки в указанном
> > порядке? Такое, по-моему, проще самому наколбасить,
> > распарсив html-ку и получив список файлов в нужном
> > порядке.  
> 
> Да, в итоге так и сделал. Просто было лень писать парсер,
> была надежда, что такая задача уже перед кем-нибудь
> вставала. :)
> 

Парсер можно готовый взять, например, hxwls из html-xml-utils.



Re: html -> pdf

2016-06-30 Пенетрантность Sergey Korobitsin
Alex Kicelew ☫ → To debian-russian@lists.debian.org @ Wed, Jun 29, 2016 22:42 
+0300

> Hi.
> 
> А есть ли в дебиане конвертор класса "сабж", не просто умеющий сгенерить
> один пдф из кучи хтмлек (это умеет и htmldoc), а еще и сам выстраивающий
> эти хтмльки в порядке обхода в глубину, если указать ему головной файл?

"В глубину" - это как если у вас есть оглавление и генератор по нему 
ходил, собирая html-ки в указанном порядке? Такое, по-моему, проще 
самому наколбасить, распарсив html-ку и получив список файлов в нужном
порядке.

> Вот этой фичи в htmldoc я не нашел, он располагает хтмльки в порядке
> перечисления в командной строке (в алфавитном, если задать *.html).
> 

-- 
Bright regards, Sergey Korobitsin,
Chief Research Officer
Arta Software, http://arta.kz/
xmpp:underta...@jabber.arta.kz

--
Пифагоровы штаны Лобачевскому смешны
 -- 



html -> pdf

2016-06-29 Пенетрантность Alex Kicelew
Hi.

А есть ли в дебиане конвертор класса "сабж", не просто умеющий сгенерить
один пдф из кучи хтмлек (это умеет и htmldoc), а еще и сам выстраивающий
эти хтмльки в порядке обхода в глубину, если указать ему головной файл?
Вот этой фичи в htmldoc я не нашел, он располагает хтмльки в порядке
перечисления в командной строке (в алфавитном, если задать *.html).