Formato del testo

È possibile esportare i documenti riconosciuti in vari formati di testo. Basta modificare le opzioni di formattazione e cliccare di nuovo il tasto Riconoscimento per riformattare i risultati dell’OCR.

Modi output

Consiglio: l’opzione Salva e Apri apre il documento riconosciuto una volta salvato. (I tipi di file Windows stabiliscono quale applicazione sarà avviata.)

Consiglio: l’opzione Invia per E-mail crea un nuovo messaggio e-mail ed inserisce il documento riconosciuto come allegato!

Consiglio: l’opzione Crea un Documento per Pagina fa in modo che ogni pagina di un documento multipagina sia salvata in un file separato. Se l’utente da’ il nome file testo.doc, i file saranno chiamati testo-1.doc, testo-2.doc ecc.

Formattazione del testo

Si ottiene un testo continuo e scorrevole. Tutta l’eventuale formattazione viene eseguita in un secondo tempo dall’utente.

(Il testo corpo è quello che si ottiene cliccando con il lato destro del mouse (menu Contesto) e selezionando il comando Copia come Testo per riconoscere la finestra sotto il cursore del mouse.)

Durante il riconoscimento vengono mantenuti il tipo di font (serif - sans serif, proportional - fisso, normal - condensato, apice - pedice), la dimensione e lo stile (grassetto, corsivo e sottolineato, apice - pedice).

Le tabulazioni e l’allineamento (a sinistra - centrato - a destra - giustificato) di ogni blocco di testo vengono ricreati.

Non vengono ricreati i blocchi di testo e le colonne - semplicemente i paragrafi si susseguono l’un l’altro.

Le tabelle vengono ricreate correttamente.

I blocchi di testo e di grafica vengono ricreati nella stessa posizione e durante il riconoscimento vengono mantenute le formattazioni di parola e di paragrafo.

Vengono ricreati gli elenchi puntati e numerati.

Il risultato è una copia conforme del documento di partenza, trattandosi ora di file di testo compatto ed editabile invece di un’immagine scansionata del documento.

I testi incolonnati sono più facili da editare rispetto a documenti che contengono numerosi riquadri: il testo scorre naturalmente da una colonna all’altra!   

Consiglio: quando il sistema non è in grado di rilevare le colonne in un documento sorgente, questo modo di formattazione utilizza comunque i riquadri come posizione di “ripiego”.

Qualsiasi testo editato, aggiunto o spostato resta all’interno della sua colonna. Nessun testo si sposta automaticamente attraverso un’interruzione colonna. Tutto il testo dopo un’interruzione colonna viene spostato nella parte superiore della colonna successiva!

Attivate questa opzione se desiderate mantenere le interruzioni di colonna dove queste sono state rilevate nel documento riconosciuto, indipendentemente dall’editing del testo dopo l’OCR.

Consiglio: nei quotidiani e nelle riviste, le diverse colonne di una pagina corrispondono spesso a diversi “pezzi” di un articolo. Se il testo si spostasse da una colonna a quella successiva, potrebbe non essere una buona idea.

Consiglio: disattivate questa opzione quando si ha un testo in colonna. In questo modo si garantirà lo spostamento naturale del testo da una colonna a quella successiva.

I formati di testo “poveri” creano un testo “semplice” (come Testo (ANSI)) non supportano codici di formattazione avanzati.

I documenti PDF implicano per natura “l’autoformattazione” ecc.

Avvertenza: WordPad è un editor di testo “ridotto”, non un elaboratore completo. WordPad può aprire file Word (DOC) e RTF ma ignora la maggior parte dei codici di formattazione come colonne, cornice di testo, allineamento ecc.

Consiglio: Readiris individua le “URL” di pagine web ed indirizzi e-mail nei documenti scanditi e li ricrea come hyperlink dell’uscita!

Opzioni

Intercalando i font si impedisce la sostituzione dei font quando gli utenti visualizzano e stampano il documento riconosciuto. Garantisce che gli utenti, indipendentemente dalla configurazione del computer, vedano il test con i font originali.

Tuttavia, intercalando i font, si aumenta la dimensione del file dei documenti riconosciuti.

Riconoscimento di tabelle - fogli elettronici

Readiris invia dati tabulari ai fogli elettronici, ai sistemi di videoscrittura e ai navigatori web: le tabelle vengono ricostruite cella dopo cella nei fogli di lavoro e inserite come oggetti tabella nei file di videoscrittura.