Als OCR (optische tekenherkenning) op een gescand document wordt uitgevoerd, wordt de tekst herkend met behulp van verfijnde patroonherkenningssoftware die gescande teksttekens vergelijkt met de tekenvormen en tekenreeksen in een ingebouwde taalwoordenlijst. In deze woordenlijst zijn alle kleine letters en hoofdletters, leestekens en accenttekens opgenomen die in de geselecteerde taal worden gebruikt.
In het programma Microsoft Office Document Imaging wordt standaard de woordenlijst gebruikt voor de taal die door de andere toepassingen van Microsoft Office wordt gebruikt. U kunt eenvoudig opgeven dat er een andere woordenlijst moet worden gebruikt als u documenten in andere talen scant.
De OCR-taalwoordenlijst wordt in de volgende scenario's gebruikt.
Nieuwe documenten scannen met behulp van Office Document Imaging
OCR wordt standaard automatisch uitgevoerd na het scannen. Als u in het menu Bestand op Nieuw document scannen klikt, wordt in het dialoogvenster Nieuw document scannen een lijst weergegeven met een aantal scandefinities die zijn ontworpen om het scannen te optimaliseren voor verschillende doeleinden. U kunt voor elke definitie een andere OCR-taal opgeven die moet worden gebruikt als die definitie wordt gebruikt.รก
Klik in het dialoogvenster Nieuw document scannen op Opties voor definitie en klik vervolgens op Nieuwe standaardoptie maken, typ een naam voor de nieuwe definitie en klik op OK of klik op Geselecteerde standaardoptie bewerken. Selecteer op het tabblad Verwerking van het dialoogvenster Opties voor definitie de gewenste taal in de lijst Taal voor OCR.
OCR uitvoeren op eerder gescande documenten
U kunt een OCR-taalwoordenlijst opgeven als u OCR handmatig wilt uitvoeren. Klik in het menu Extra op Opties, klik op het tabblad OCR en selecteer de gewenste woordenlijst in de lijst Taal voor OCR. Klik vervolgens in het menu Extra op Tekst herkennen met OCR.
Een andere taal toevoegen aan de index voor versneld zoeken naar bestanden
De Indexing-service is een speciale service die het mogelijk maakt om snel naar bestanden te zoeken op de computer. De tekst die in de bestanden op uw computer is gevonden, wordt aan de index toegevoegd. In de index wordt ook een verwijzing opgeslagen naar het bestand waarin de tekst is gevonden. Tekst die zich in de tiff-bestanden (Tagged Image File Format) en mdi-bestanden (Microsoft Document Imaging Format) op uw computer bevindt, wordt standaard aan de index toegevoegd.
Als u de taalwoordenlijst wilt wijzigen die wordt gebruikt om tiff-en mdi-bestanden te indexeren waarop nog geen OCR is uitgevoerd, klikt u in het menu Extra op Opties, klikt u op het tabblad OCR en klikt u vervolgens op Indexing-service. Selecteer in het dialoogvenster Indexing-service de gewenste woordenlijst in de lijst Taal voor OCR.
U kunt speciale definities maken voor het scannen van documenten in een vreemde taal.