OCR voor andere talen

Als OCR (optische tekenherkenning) op een gescand document wordt uitgevoerd, wordt de tekst herkend met behulp van verfijnde patroonherkenningssoftware die gescande teksttekens vergelijkt met de tekenvormen en tekenreeksen in een ingebouwde taalwoordenlijst. In deze woordenlijst zijn alle kleine letters en hoofdletters, leestekens en accenttekens opgenomen die in de geselecteerde taal worden gebruikt.

In het programma Microsoft Office Document Imaging wordt standaard de woordenlijst gebruikt voor de taal die door de andere toepassingen van Microsoft Office wordt gebruikt. U kunt eenvoudig opgeven dat er een andere woordenlijst moet worden gebruikt als u documenten in andere talen scant.

OCR wordt standaard automatisch uitgevoerd na het scannen. Als u in het menu Bestand op Nieuw document scannen klikt, wordt in het dialoogvenster Nieuw document scannen een lijst weergegeven met een aantal scandefinities die zijn ontworpen om het scannen te optimaliseren voor verschillende doeleinden. U kunt voor elke definitie een andere OCR-taal opgeven die moet worden gebruikt als die definitie wordt gebruikt.á

Klik in het dialoogvenster Nieuw document scannen op Opties voor definitie en klik vervolgens op Nieuwe standaardoptie maken, typ een naam voor de nieuwe definitie en klik op OK of klik op Geselecteerde standaardoptie bewerken. Selecteer op het tabblad Verwerking van het dialoogvenster Opties voor definitie de gewenste taal in de lijst Taal voor OCR.

U kunt een OCR-taalwoordenlijst opgeven als u OCR handmatig wilt uitvoeren. Klik in het menu Extra op Opties, klik op het tabblad OCR en selecteer de gewenste woordenlijst in de lijst Taal voor OCR. Klik vervolgens in het menu Extra op Tekst herkennen met OCR.

De Indexing-service is een speciale service die het mogelijk maakt om snel naar bestanden te zoeken op de computer. De tekst die in de bestanden op uw computer is gevonden, wordt aan de index toegevoegd. In de index wordt ook een verwijzing opgeslagen naar het bestand waarin de tekst is gevonden. Tekst die zich in de tiff-bestanden (Tagged Image File Format) en mdi-bestanden (Microsoft Document Imaging Format) op uw computer bevindt, wordt standaard aan de index toegevoegd.

Als u de taalwoordenlijst wilt wijzigen die wordt gebruikt om tiff-en mdi-bestanden te indexeren waarop nog geen OCR is uitgevoerd, klikt u in het menu Extra op Opties, klikt u op het tabblad OCR en klikt u vervolgens op Indexing-service. Selecteer in het dialoogvenster Indexing-service de gewenste woordenlijst in de lijst Taal voor OCR.

Weergeven Tip

U kunt speciale definities maken voor het scannen van documenten in een vreemde taal.

Klik in het menu Bestand op Nieuw document scannen en selecteer vervolgens in de lijst een definitie die u als basis voor uw nieuwe definitie wilt gebruiken. Klik op Opties voor definitie en klik op Nieuwe standaardoptie maken.
Typ een naam voor de nieuwe definitie en klik op OK. Selecteer op het tabblad Verwerking van het dialoogvenster Opties voor definitie de gewenste taal in de lijst Taal voor OCR.
U kunt een snelkoppeling maken voor de nieuwe definitie. Klik op het tabblad Algemeen op Snelkoppeling maken nadat u de gewenste opties voor de definitie hebt geselecteerd.