Come funziona l'OCR? Spiegato in modo semplice e comprensibile
In questo articolo spieghiamo come funziona l'OCR. OCR sta per "Riconoscimento ottico dei caratteri" ed è semplicemente indicato in tedesco come riconoscimento del testo. Ciò significa che un computer può riconoscere il testo su un'immagine acquisita tramite OCR e quindi convertirlo in un semplice documento di testo.
Ecco come funziona l'OCR
Immagina di aver ricevuto una presentazione cartacea da un collega. Ora vuoi modificarli sul PC perché non ti piacciono i singoli passaggi. Quindi scansionalo e vai al tuo programma OCR. Ora succede quanto segue:
- Il software esegue innanzitutto una cosiddetta analisi di layout. Per fare ciò, guarda il layout della pagina e separa le immagini dal testo. Annota anche la loro posizione sulla pagina. Quindi viene conteggiato il numero di paragrafi e vengono salvati singoli elementi come i numeri di pagina.
- Ora arriva la parte difficile. Il software esamina i singoli blocchi di testo e li suddivide in frasi. Le frasi vengono quindi suddivise in singole parole e le parole in lettere.
- Il software OCR contiene modelli di lettere e caratteri. Il programma ora confronta le lettere scansionate con questi schemi. Se sono simili al 99%, l'algoritmo decide che probabilmente deve essere quella lettera. È molto preciso perché può confrontare molti modelli in breve tempo. In questo modo distingue con successo tra un "8" e una "B".
- Quindi le lettere e i caratteri vengono gradualmente riconosciuti. Quindi vengono nuovamente combinati come parole e rimessi al loro posto nella frase. Non appena il software è finito, il tutto viene salvato in un normale documento, che è quindi possibile modificare. Fatto!
Vuoi testare la tua conoscenza del software? Partecipa al nostro grande quiz sul software!