Ciao a tutti, scrivo per sapere se qualcuno di voi si è già imbattuto in questa problematica o ha qualche consiglio da darmi.
Ho un blog con circa 700 articoli scritti durante i miei 5 anni di residenza in Lituania, visto che ho toccato tutti gli argomenti vorrei farne un libro. Per recuperare i post ho visto che c'è un bel script: http://python-wordpress-xmlrpc.readthedocs.org/en/latest/examples/posts.html L'ho provato e funziona, ottengo gli articoli. Ora il problema è pulirli dal codice html e collezionarli in modo che siano pubblicabili in un PDF che andrà a finire in mano all'editore per una prima analisi. Per la pulizia del testo dall'html ho alcuni dubbi. In alcuni casi utilizzavo la formattazione classica dell'html per dare enfasi al testo, a volte includevo dei link e dei video youtube. Forse è meglio aggiungere i link alla fine dell'articolo giusto per referenza? Per creare il pdf potrei generare un documento latex. Pur conoscendo il latex, non ho mai "automatizzato" il processo, voi sapete qualcosa a proposito? Fatto il PDF, devo usare tutti questi articoli per mandare a deambulare Wordpress e passare a Django, ma questa è un'altra storia... Vi ringrazio. Ciao -- Karim Gorjux
_______________________________________________ Python mailing list Python@lists.python.it http://lists.python.it/mailman/listinfo/python