Main menu

Pages

Programmi OCR per convertire fogli di carta e PDF in testi modificabili

OCR ToolOCR è la sigla che sta per Optical Character Recognition (riconoscimento ottico dei caratteri) èd è una tecnologia che permette di convertire immagini e PDF contenenti testi scritti in documenti modificabili con i normali programmi per testi come Microsoft Word. Senza entrare nel dettaglio tecnico, un software OCR consente quindi di prendere un foglio scritto e convertirlo in un documento, le cui parole siano modificabili. Questo tipo di software è necessario quando utilizziamo lo scanner, visto che spesso verranno generate delle immagini invece che un documento già pronto all'uso; grazie all'OCR possiamo riconoscere i testi scritti su un'immagine JPEG o in altri formati grafici e ottenere così un testo leggibile, da salvare successivamente in formato documento digitale (PDF o Word).

In questo articolo vediamo quali sono i migliori programmi e siti web per convertire un documento cartaceo (stampa, fax, fascicolo etc.) in un documento digitale PDF o in un file documento modificabile (con Microsoft Word o programmi simili).

LEGGI ANCHE: Riconoscere ed estrarre testo da immagine su Android con le app OCR

Programmi e siti per OCR


Tutti i programmi e i siti che vi illustreremo forniscono la conversione OCR gratuitamente: non dovremo quindi pagare nulla per passare i documenti cartacei in formato digitale, solo scegliere il tool adatto alle nostre esigenze o il programma che reputiamo migliore per il numero di fogli da convertire in digitale.

Programmi per conversione OCR


Il primo programma che vi consigliamo di provare per convertire fogli di carta e PDF in testi modificabili è PDF23 Creator, scaricabile dal sito ufficiale.
PDF24 OCR
Con questo valida suite per i PDF possiamo convertire i documenti di testo cartacei in PDF modificabili in pochi e semplici passi. Per utilizzare questo programma apriamo l'app PDF24, premiamo sul menu Riconosci testo, premiamo in alto su Aggiungi file e infine premiamo in alto su Avvia per avviare il riconoscimento dei caratteri scansionati. Al termine della conversione premiamo in alto su Salva file per salvare i nuovi file PDF con il testo scansionato.

Altro valido programma che possiamo utilizzare sul nostro PC per convertire i fogli in PDF tramite OCR è programma Microsoft OneNote, disponibile al download gratuito dal Microsoft Store.
OneNote
Per estrarre il testo dalle immagini per prima cosa aggiungiamo l'immagine ad una delle note del programma, premendo in alto su Inserisci e premendo sul menu Immagini. Dopo aver aggiunto l'immagine alla pagina della nota premiamo con il tasto destro su di essa e utilizziamo la voce Copia testo dall'immagine per avviare l'OCR incluso nel programma; se l'immagine contiene più pagine da importare possiamo utilizzare anche la voce Copia testo da tutte le pagine della stampa, così da ottenere tutto il testo in OCR.
Per approfondire possiamo leggere la nostra guida Scarica gratis Microsoft OneNote per Windows, Mac e smartphone.

Se cerchiamo invece un programma gratuito e open source per usare l'OCR vi consigliamo di provare Cognitive OpenOCR (Cuneiform), disponibile dal sito ufficiale.
Cuneiform
Cognitive OpenOCR (Cuneiform) è un programma open source che permette di fare il riconoscimento ottico dei caratteri (OCR) e quindi di trasformare le immagini in documenti di testo modificabili con Word o altri programmi. Cuneiform supporta 23 lingue tra cui l'italiano e dispone di speciali algoritmi per il riconoscimento di testo da stampante, fax e fotocopie. Riconosce automaticamente, senza difficoltà di uso, i blocchi di testo, le tabelle e le immagini e conserva il layout della pagina in maniera perfetta.
Per utilizzarlo è sufficiente premere in alto su Recognition Wizard e seguire i passaggi guidati per importare un'immagine e convertirla velocemente in un file di testo digitale.

Siti web per conversione OCR


Se vogliamo utilizzare un sito per convertire fogli di carta e PDF in testi modificabili, possiamo affidarci a Google Docs, la suite d'ufficio gratuita offerta da Google e raggiungibile al sito ufficiale.
Google Docs
Per sfruttare questa possibilità portiamoci prima di tutto su Google Drive, premiamo sull'icona dell'ingranaggio in alto a desta, apriamo il menu Impostazioni e, nella finestra che comparirà, attiviamo la voce Converti i file caricati nel formato dell'editor di Documenti Google.
Ora è sufficiente caricare qualsiasi documento PDF o immagine su Google Docs per poterla modificare con gli strumenti offerti dal sito, con la conversione OCR che avverrà automaticamente, come visto anche nella guida Estrarre testo da un PDF o da una immagine con Google Docs.

Altro servizio web valido per convertire i fogli con l'OCR è onlineocr.net, raggiungibile dal sito ufficiale.
Free OCR
Per utilizzare questo servizio carichiamo i file immagine premendo su Seleziona file, selezioniamo la lingua del testo, scegliamo il formato del file immagine finale (Word o Excel) e infine premiamo sul tasto Converti, così da poter scaricare i documenti di testo modificabili realizzati partendo dall'OCR delle immagini caricate.

Altro servizio web che vi consigliamo di utilizzare per convertire fogli di carta e PDF in testi modificabili è Convertio, raggiungibile dal sito ufficiale.
Convertio OCR
Utilizzando questo servizio avremo a disposizione 10 pagine da poter convertire gratuitamente, non dobbiamo far altro che premere sul tasto Scegli file (ma possiamo accedere anche ai file immagine provenienti dal cloud), attendere il riconoscimento del testo e infine avviare il download del documento, che potrà essere salvato in formato Word, PDF o altri formati di testo noti.

Altri siti e programmi per OCR


Anche se i siti e i programmi visti in alto sono in grado di soddisfare tutti i tipi di impegni in cui è necessario utilizzare un OCR, su Internet possiamo sempre trovare nuovi strumenti, tool e siti per l'OCR. Se cerchiamo delle valide alternative diamo uno sguardo alle informazioni presenti qui in basso:
  • Trascrivere testo nelle foto con Google Keep è il modo più facile anche se non funziona con i PDF.
  • SimpleOCR è un programma semplice e basilare capace di rendere modificabili testi scritti su carta e scansionati al computer, con riconoscimento ottico dei caratteri. Con SimpleOCR è possibile convertire ogni documento cartaceo in testo elettronico modificabile da utilizzare anche con Word.
  • Easy Screen OCR è un programma gratuito per Windows 10 e Windows 7 che consente di estrarre e acquisire testo da qualsiasi immagine o screenshot. Lo strumento Easy Screen OCR (Optical Character Recognition) è in grado di catturare e convertire screenshot in testo. Può estrarre testo da un'immagine, un video, un sito Web, documenti. Alimentato da Google OCR, che garantisce un'elevata precisione di riconoscimento, questo programma gratuito supporta oltre 100 lingue.
  • Boxoft Free OCR Converter è un altro ottimo programma gratuito che consente di estrarre testo da tutti i tipi di immagini (comprese quelle di fogli scansionati con lo scanner), in più lingue tra cui inglese, francese, tedesco, italiano, olandese, spagnolo, portoghese e altro. Oltre alle immagini, può anche scansionare copie cartacee di documenti e convertirli in testo modificabile.
  • NewOCR attualmente offre solo l'estrazione di testo da file da immagini e foto, ma supporta alcune altre funzionalità che molti siti OCR online non offrono, come quella di impostare più lingue di riconoscimento, utile anche a ottenere una traduzione corretta dal testo. Se l'immagine è inclinata, si può anche ruotarla dinamicamente.
  • OCR.space è sicuramente una delle opzioni più robuste che abbiamo trovato, uno dei migliori strumenti OCR che supporta anche il formato di file WEBP oltre a PNG, JPG e PDF. Inoltre, non è necessario caricare un file, è possibile usare l'URL di un'immagine online. Altre funzioni sono la rotazione automatica , la scansione delle ricevute , il riconoscimento delle tabelle e il ridimensionamento automatico. Il testo estratto può essere anche salvato in un PDF o come file JSON.
  • Fine Reader Online è un sito web per convertire un'immagine in un file di testo oppure un file pdf in uno Word, sempre modificabile. Questa ultima funzione, la conversione di file da .pdf a .doc si può fare anche con altri software specifici per modificare file pdf. Quando si parla di una immagine convertita in file di testo, in questo caso, si intende una pagina scansionata e salvata tramite il programma di gestione di un normale scanner, in un file jpeg, gif, bmp o tiff. Per usare il sito bisogna registrarsi e viene riconosciuta la conversione di file scritti in qualsiasi lingua, compresa la lingua italiana.
  • OCR TO Word è un semplice e potente programma capace di estrarre testo da un PDF o da un documento acquisito con lo scanner. Il testo estratto può poi essere modificato su Word.
  • Capture2Text è un programma in grado di copiare testo dalle immagini con facilità e con una interfaccia molto semplice da usare

Prima di scegliere proviamoli tutti, così sarà più semplice convertire le immagini in nostro possesso in documenti digitali perfetti.

Conclusioni


Le prestazioni di questi programmi dipendono molto dalla qualità dell'immagine che si vuole far riconoscere e dalla sensibilità dello scanner usato: si passa da testi riprodotti in modo identico a casi in cui non viene riconosciuta nemmeno una parola. Tutti i programmi e i siti web funzionano molto bene, ma la potenza dell'OCR dipende molto dalla qualità dell'immagine che si da in pasto a questi strumenti avanzati.

In un'altra guida abbiamo visto come fare Copia e incolla il testo in foto, immagini e video su internet con Chrome.
Se cerchiamo invece un programma valido per lo scanner su PC, possiamo leggere la nostra guida Migliori programmi per usare lo Scanner con PC Windows.
reactions

Commenti

table of contents title