24/11/2008

Convertire le pagine HTML in PDF con HtmlDoc.

HtmlDoc è un piccolo programma scritto in C++ che permette di convertire le pagine HTML in PDF o PS, convertendo i collegamenti e le immagini automaticamente.

Per installarlo utilizzate Synaptic oppure digitate in un terminale:

sudo apt-get install htmldoc

Finita l'installazione aprite la finestra "Esegui applicazione..." e digitate "htmldoc" senza virgolette.

All'apertura il programma si presenta così:

htmldoc01.png

Nella scheda "Input" facendo clic sul pulsante "Add Files..." selezionate uno alla volta il o i file HTML che volete convertire

htmldoc02.png

Invece, fate clic sul pulsante "Add URL..." se volete inserite uno alla volta l'url delle pagine HTML che volete convertire.

htmldoc03.png

Nell'esempio che vi propongo ho trasformato un mio articolo in pdf andando ad inserire l'url.

Tenete presente che l'ordine in cui andate ad inserire le pagine HTML viene conservato. 

Selezionate una delle tre voci in corrispondenza di "Document Type":

  • Book se volete creare un file pdf con una copertina e un indice costruito automaticamente.
  • Continuous se non volete lasciare spazi bianchi nella trasformazione da pagine web in pagine pdf.
  • Web Page se volete, al contrario della precedente opzione, far cominciare le pagine del pdf con gli spazi delle pagine web.

Nel mio caso ho scelto l'opzione "Web Page".

htmldoc04.png

Nella scheda "Output" scegliete se volete creare un file pdf o ps, inserite il suo nome insieme per percorso della cartella in cui verrà salvato ed eventualmente selezionate un livello di compressione per le immagini jpeg.

htmldoc05.png

Nella scheda "Page" potete regolare le dimensioni del foglio che verrà utilizzato, il suo senso, la dimensione dei margini ecc.

htmldoc06.png

Nella scheda "Colors" potete scegliere il colore del testo, dei collegamenti, se scegliere un'immagine o un colore di sfondo. Se desiderate che i collegamenti siano sottolineati selezionate, in corrispondeza della voce "Link Style", l'opzione "Underline", altrimenti "Plain".

htmldoc07.png

Nella scheda "Fonts" potete modificare tutto quello che riguarda il tipo e la dimensione del carattere, compresa l'interlinea.  Per la codifica dei caratteri "Character Set" , iso-8859-1 corrisponde alla codifica usata nei paesi dell'Europa occidentale, se utilizzate la codifica iso-8859-15 vi verranno riconosciuti anche alcuni simboli speciali come "€". Devo ammettere però che il riconoscimento degli accenti non funziona bene per tutte le pagine anche se si cambia la codifica.

htmldoc08.png

Nella scheda "PDF" potete modificare le impostazioni del pdf che verrà creato tra le quali anche la versione del pdf, io vi consiglio di mettere la 1.4 che dovrebbe essere riconosciuta senza problemi di compatibilità.

htmldoc09.png

Nella scheda "Security" potete impostare una password per il pdf.

htmldoc10.png

Adesso non vi resta che fare clic sul pulsante "Generate" per creare il vostro pdf.

Finita l'elaborazione non vi resta che aprire il pdf appena generato e guardare il risultato.

Emanuele

08:00 Scritto da: ciaolinux in Kubuntu, pdf, Ubuntu, Xubuntu | Link permanente | Commenti (3) | Segnala | Tag: ubuntu, kubuntu, xubuntu, pdf | OKNOtizie |  Facebook

Commenti

Ciao ottimo questo programma,e da un po di tempo che cercavo su linux qualcosa del genere per sostituire l opzione di adobe acrobat professional che purtroppo gira solo si windows,però io ho un problema vorrei molto disperatamente convertire questa pagina (http://mariuanait.com/ilcanapaio/ilcanapaio.htm#luce)in pdf,ma quasi alla fine mi da un errore,praticamente non riesce a formattare una pagina con delle foto,ho provato e riprovato cambiando vari settaggi ma niente da fare,a parte che il programma è in lingua inglese ed io l inglese non lo mastico per niente bene,se vuoi ti posso anche dire la pagina qual è dell errore,puoi fare qualche prova e magari capire se è risolvibile? Grazie

Scritto da: Davide | 22/11/2010

Prova ad usare questo programma e dimmi se hai lo stesso problema: http://www.simple-linux.com/it/convertire-le-pagine-html-in-pdf-con-html-to-pdf-converter/

Scritto da: Emanuele | 22/11/2010

Ciao, Grazie per la risposta,questo converte bene ma dopo se apro il file non mi fa cliccare i collegamenti,cioè mi spiego meglio ad inizio pagina c'è l indice di tutti i capitoli esempio se a me interessa leggere il capitolo della fioritura cliccando mi porta alla pagina da leggere,praticamente questo programma e come fare stampa su file e poi scelgo pdf ma resta lo stesso problema che non posso cliccare i collegamenti.
Online ci sono anche dei siti che convertono ed anche bene ma a me non piace che dopo nel file mi ci trovo la stringa del sito tipo publicità,certo che htmldoc è serio come programma e son sicuro che da qualche parte ci sarà qualche settaggio per risolvere il problema purtroppo è in inglese ho fatto tantissimi tentativi ma niente.
Emanuele comunque Grazie

Scritto da: Davide | 23/11/2010

Scrivi un commento