13/08/2008

Riconoscimento ottico dei caratteri (OCR) con Kooka.

Kooka è un programma Open Source molto intuitivo e facile da usare che permette di utilizzare il proprio scanner per acquisire foto o testi.

Per poter fare il riconoscimento ottico dei caratteri installate il pacchetto ocrad (consigliato) oppure gocr (meno efficiente di ocrad).

In questa piccola guida che vi propongo utilizzerò il motore ocrad, per installarlo utilizzate Synaptic oppure digitate in un terminale:

sudo apt-get install ocrad

Per eseguire l'ocr seguite le seguenti istruzioni.
Aprite Kooka, lo trovate nel menù applicazioni sotto la voce Grafica.
Andate nel menù Impostazioni>Configura Kooka...

957829479.png

Nella finestra che appare andate nella voce "OCR" e selezionate il motore OCRAD. Applicate le modifiche e chiudete la finestra.

2125933495.png

Nella finestra "Impostazioni scanner" in basso a sinistra di Kooka in "Scan Mode" selezionate la voce "Lineart" ed in risoluzione mettete "300".

1138164231.png

Fate clic su Anteprima ed aspettate che lo scanner abbia finito; nella finestra dell'anteprima selezionate il testo da riconoscere e fate clic sul pulsante "Scansione finale".  

Nella finestra di salvataggio della scansione che appare selezionate il formato .png e fate clic su "OK".

235413993.png

L'immagine appena salvata compare nella sezione in basso a destra della finestra Kooka, selezionatela e fate clic sull'icona "OCR sull'immagine" nella barra delle icone (è la seconda icona a destra della stampante). 

862455897.png

Nella finestra che appare potete selezionare un modo di analisi del livello OCRAD adatto al documento (a colonne o completo); nella scheda "Controllo ortografico in corso" della stessa finestra selezionate la voce "Abilita controllo ortografico..." e nelle opzioni selezionate "ISO 8859-1" per codifica e "Aspell" per Client. Fatto tutto ciò cliccate sul pulsante "Avvia OCR".

1959293577.png

Fatto il riconoscimento, correggete gli errori insieme alla finestra "Controllo del dizionario OCR di Kooka". Copiate ed incollate il testo dalla finestra "Testo prodotto dall'OCR" in un editor di testo (per esempio Writer di OpeneOffice).

1235770169.png

Il risultato che ho ottenuto facendo le mie prove è soddisfacente.

Se volete recuperare i file scansionati con Kooka li trovate nella cartella nascosta /.kde/share/apps/ScanImages/ nella vostra cartella Home.

Emanuele

08:00 Scritto da: ciaolinux in Kubuntu | Link permanente | Commenti (0) | Segnala | Tag: kubuntu | OKNOtizie |  Facebook

Scrivi un commento