Questo capitolo fornisce indicazioni dettagliate sul formato PDF come supportato da Readiris e sui modi in cui potete fare di esso l’uso migliore.
Il formato PDF Testo dà origine a un file PDF ricercabile, contenente un testo (e possibilimente zone di grafica per foto, artwork ecc.). La immagine della pagina non viene contenuta nel file PDF monostrato.
Il formato PDF Immagine-Testo dà origine ad un file ricercabile PDF che contiene l’immagine della pagina ed il testo riconosciuto. L’immagine della pagina è contenuta nel file doppio strato PDF sopra il testo.
Nota: viene usata compressione per tutti gli elementi. Le immagini in bianco-nero sono TIFF Gruppo 4 compresse, le immagini della scala dei grigi e a colori sono invece file JPEG di qualità 0,8. Il testo è compresso usando la modalità Gzip.
Consiglio: Readiris consente di creare automaticamente segnalibri (“bookmarks”).
Consiglio: Readirs consente di intercalare i font nei documenti PDF!
I file PDF “solo testo” sono molto più compatti che i file di immagini!
I testi basati su file PDF sono ricercabili. (I bitmap di immagini - file PDF “solo immagine” - possono essere visti ma non ricercati.)
I file PDF basati sui testi possono essere editi. (I bitmap di immagini possono essere visti ma non editi.)
Il testo riconosciuto può ovviamente essere edito e riusato. (I bitmaps di immagini possono essere visti ma non non editi.)
Usate il Ritocco Testo del software Acrobat per correggere piccoli errori di riconoscimento nel file PDF.
Consiglio: è necessario disporre della versione appropriata di Adobe Reader per visualizzare in modo corretto i file PDF! Per visualizzare e stampare testi di lingue dell’Europa centrale (come il ceco e il polacco), testi di lingue baltiche, testi in turco o in caratteri cirillici (“russo”) in formato PDF, è necessario disporre della versione speciale “CE” (Europa centrale) di Adobe Reader. Per visualizzare e stampare documenti ebraici in PDF, utilizzare la versione in ebraico o medio-orientale di Adobe Reader. (Il software è reperibile sul CD-ROM Readiris.)
È possibile isolare un testo da un file PDF “immagine-testo”. È possibile anche convertire file PDF “solo testo” in file di testo. Aprire il file con Adobe Acrobat e usare il commando Salva Come per salvarlo in un file di testo (in formato Word, RTF, HTML o Testo).
Per riusare piccole porzioni di testo da un file PDF in altre applicazioni, selezionare lo strumento di Seleziona Testo del software Adobe Acrobat, selezionare il testo richiesto e procedere al copia-incolla in un’altra applicazione. (Il comando Seleziona Tutto seleziona tutto il testo della pagina attuale o dell’intero documento, a seconda del modo di visualizzazione.)
Usare il comando Trova, del software Adobe Acrobat o Adobe Reader per ricerche semplici nell’ambito di un documento e per ricerche avanzate attraverso diversi documenti PDF.
Il pulsante Trova del software di Adobe Acrobat o Adobe Reader rintraccia parole complete o parti di parole nel documento PDF in esame. Acrobat cerca la parole, leggendo in sequenza tutte le parole di tutto il testo del file.
Il pulsante Trova del software di Adobe Acrobat (Reader) vi permette di fare una ricerca rapida di tipo avanzato su una raccolta di documenti PDF organizzati per indici.
Potete ricercare una semplice parola o una frase
Potete estendere la vostra ricerca usando caratteri jolly o operatori booleani
Potete usare le opzioni di ricerca per affinare ulteriormente la vostra ricerca
La ricerca con riferimento agli indici implica che l’indice “testo completo” è stato creato per una raccolta di file PDF a mezzo del comando Catalog. (Per indice “testo completo” intendiamo un elenco alfabetico di tutte le parole usate in un documento o in una serie di documenti). La ricerca basata sull’indice è molto più rapida rispetto alla lettura sequenziale: Adobe Acrobat e Adobe Reader vanno direttamente alla parola inserita nella lista invece di leggere l’intero documento.