ALIs

kommt noch

Kurzanleitung zu FineReader 6.0 Professional zum Erkennen von Text

Dies ist eine Kurzanleitung. Hier werden nur die wichtigsten Schritte beschrieben.

Grundlegende Informationen finden Sie in der Schrift "Tipps zum Scannen".

Beachten Sie auch die Hinweise für die "SCSI-Scanner".

Bei den Scanner-PCs finden Sie u. a.:

Schrift Ordner
SCSI-Scanner A4/A3-SCANNER
FineReader
  - Diese Kurzbeschreibung
  - Originaldokumentation
A4/A3-SCANNER
A0-SCANNER
VueScan
  - Kurzbeschreibung
  - Originaldokumentation (engl.)
A4/A3-SCANNER
WIDEimage
  - Kurzbeschreibung
  - Originaldokumentation
A0-SCANNER

Möglichkeiten

FineReader ist ein Programm zur optische Zeichenerkennung, engl. optical character recognition (OCR).

Die erweiterte Version "Kyrillisch Plus" erkennt 177 Sprachen in Lateinisch, Griechisch und Kyrillisch. Genauere Angaben finden Sie unter dem Kapitel "Einstellungen".

Schriftart, Schriftgröße, Schriftschnitt (fett, kursiv), Seitenaufteilung (Layout) und Grafiken können übernommen werden.

FineReader können Sie mit den folgenden Scannern benutzen:

  • A4-Scanner Hewlett Packard ScanJet 4c ADF
  • A3-Scanner UMAX PowerLook 2100XL
Zuvor Scannen mit dem Programm VueScan
und in Datei ablegen. Bei TIFF ist umspeichern
notwendig, z. B. mit IrfanView.
  • A0-Scanner Contex CHROMA XL 42 PLUS
WIDEtwain/image wird automatisch aufgerufen.

Wählen Sie im Erfassungsprogramm nach Bedarf Graustufen oder Farbe. Für die Texterkennung sollte die Auflösung 300 dpi betragen, bei kleinen Schriften besser 400 dpi.

Aufruf des Programms

Starten Sie das Programm FineReader durch Doppelklick auf das gleichnamige Symbol:

FineReader 5.0 Pro

Zur Begrüßung werden Ihnen Lernmöglichkeiten abgeboten.

An dieser Stelle wollen wir aber nicht darauf eingehen. Wählen Sie "Schließen".

Willkommen! Lernen Sie ...

Sie haben nun das Hauptfenster vor sich:

ABBYY FineReader 6.0 Professional

Einstellungen

Die unterste Symbolleiste enthält die Assistenstensymbole. Über diese steuern Sie die Verarbeitung. Die Anwahl eines Symbols führt die angezeigte Aktion aus. Die Anwahl des kleinen Dreiecks rechts neben einem Symbol erlaubt die Auswahl möglicher Aktionen.

Scan&Read/Open&Read:

"Scan"/"Scannen" ist nur beim A0-Scanner möglich. "Open"/"Öffnen" bezieht sich auf schon erfasste Dateien.

"Read"/"Lesen" bedeutet Einlesen in FineReader mit Durchführung der Texterkenunng (OCR).

Wurde die Vorlage schon als Bild in einer Datei erfasst, können die folgenden Dateiformate gelesen werden:

Bitmap (*.bmp) JPEG (*.jpg, *.jpeg, *.jfif) PNG (*.png) (Portable Network Graphics)
DCX (*.dcx) PCX (*.pcx) TIFF (*.tif, *.tiff)  
    PDP (*.pdf) (Portable Document Format)

Folgende Dateiformate können geschrieben werden:

MS Word-Dokument (*.doc) Unicode Text (UTF-16) (*.txt)  
Rich Text Format (*.rtf) Unicode Text (UTF-8) (*.txt)
PDF-Dokument (*.pdf) MS Excel-Dokument (*.xls)
HTML-Dokument (*.htm) DBF-Dokument (*.dbf)
Unicode HTML (UTF-8) (*.htm) CSV-Dokument (*.csv) (Comma
Separated
Values)
Text-Dokument (*.txt) Unicode CSV (UTF-16) (*.csv)
  Unicode CSV (UTF-8) (*.csv)

Originalbilder können in den folgenden Dateiformaten geschrieben werden:

Bitmap (*.bmp) JPEG (*.jpg, *.jpeg, *.jfif) PNG (*.png) (Portable Network Graphics)
  PCX (*.pcx) TIFF (*.tif, *.tiff)  

Durch Anwahl des kleinen Dreiecks bei "Lesen", "Rechtschreibung" und "Speichern" lassen sich auch Optionen einstellen.

Hier die wichtigsten:

Optionen / Erkennung Optionen / Formatierung

Die Sprache(n) wählen Sie über die erstgezeigten Registerkarte "Erkennung" unter "Sprachen verarbeiten...":

Hauptsprachen:
Armenisch (Ostarmenisch, Westarmenisch, Grabar), Bulgarisch, Dänisch, Deutsch (neue und alte Rechtschreibung), Englisch, Estnisch, Finnisch, Französisch, Griechisch, Italienisch, Katalanisch, Kroatisch, Lettisch, Litauisch, Niederländisch (Niederlande und Belgien), Norwegisch (Nynorsk und Bokmål), Polnisch, Portugiesisch (Portugal und Brasilien), Rumänisch, Russisch, Slowakisch, Spanisch, Schwedisch, Tatarisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch

Künstliche Sprachen:
Esperanto, Interlingua, Ido, Okzidentalisch

Formelsprachen:
Basic, C/C++, COBOL, Fortran, JAVA, Pascal, Einfache chemische Formeln

Zusätzliche Sprachen:
Abchasisch, Adygisch, Afrikaans, Agul, Albanisch, Altai, Aserbaidschanisch (Kyrillisch), Aserbaidschanisch (Latein), Awarisch, Aymará, Baschkirisch, Baskisch, Bemba, Blackfoot, Bretonisch, Bugotu, Burjat, Cebuano, Chakassisch, Chamorro, Chantisch, Chukchee, Crow, Dakota, Dargwa, Deutsch (Luxemburg), Dungan, Eskimo (Kyrillisch), Eskimo (Latein), Ewenkisch, Ewenkisch, Färöisch, Fidschianisch, Friesisch, Friaulisch, Gagauz, Galizisch, Ganda, Gälisch (Schottland), Guaraní, Hani, Haussa, Hawaiisch, Isländisch, Indonesisch, Inguschisch, Irisch, Jakut, Jingpo, Kabardinisch, Kalmückisch, Karatschaiisch-Balkarisch, Karakalpak, Kasachisch, Kasubisch, Kawa, Kikuyu, Kirgisisch, Kongolesisch, Korjak, Korsisch, Kpelle, Kumykische, Kurdisch, Lak, Latein, Lesgisch, Luba, Makedonisch, Malagasisch, Malaiisch, Malinke, Maltesisch, Mansisch, Maorisch, Mari, Maya, Miao, Minangkabau, Mohawk, Moldawisch, Mongolisch, Mordwinisch, Nahuatl, Nenzisch, Niwch, Nogaiisch, Nyanja, Ojibway, Ossetisch, Papiamento, Pidginenglisch (Tok Pisin), Provenzalisch, Quechua, Rätoromanisch, Romani, Ruandisch, Rundi, Russisch (alte Rechtschreibung), Samisch (Lappisch), Samoanisch, Selkup, Serbisch (Kyrillisch), Serbisch (Latein), Shona, Slowenisch, Somali, Sorbisch, Sotho, Sunda, Suaheli, Swasiländisch, Tabassaranisch, Tadschikisch, Tagalog, Tahitisch, Tatarisch (Krim), Tonganisch, Tschetschenisch, Tschuwaschisch, Tswana, Tun, Turkmenisch, Tuwinisch, Udmurt, Usbekisch (Kyrillisch), Usbekisch (Latein), Walisisch, Weißrussisch, Wolof, Xhosa, Zapotekisch, Zulu

Anmerkung: "Inuit" finden Sie unter der falschen Bezeichnung "Eskimo".

Nähere Angaben zu den Sprachen (auch Verbreitungsgebiet) finden Sie wie folgt:

  • Wählen Sie im Menü "Hilfe" die "Hilfethemen".
  • Wählen Sie im zweiten Punkt "Allgemeine Funktionen von ABBYY FineReader" den letzten Unterpunkt "In FineReader unterstützte Sprachen".
  • Wählen Sie die jeweilige Sprache.

Ablauf der Texterkennung

Wählen Sie neben dem Assistenstensymbol "Scan&Read/Open&Read" das kleine Dreieck:

Open&Read-Auswahl   Dann können Sie wählen:
  • für Erfassung über den A0-Scanner
  • dto., empfohlen bei mehreren Seiten
  • für schon in Datei erfasste Vorlage
  • alles mit Benutzerführung

Wenn Sie den Assistenten wählen, werden Sie bis zum Abspeichern der Datei geführt. Dabei erscheinen mehr Fenster als in dieser Beschreibung aufgeführt sind.
Alternativ können Sie die einzelnen Punkte - Scannen/Lesen, Rechtschreibprüfung, Speichern - auch nacheinander anwählen.

Für den A0-Scanner wird nun bei Auswahl von "Scan" das scanner-spezifische Erfassungsprogramm aufgerufen.
(Für die anderen Scanner muss die Quelle als Datei vorliegen.)

Nochmal zur Erinnerung:
Für die Texterkennung sollte die Auflösung 300 dpi betragen, bei kleinen Schriften besser 400 dpi.

Schließlich führt FineReader das "Einlesen" durch, also die Texterkennung.

FineReader-Fenster mit erkannter Seite

Der Aufbau des vorigen Fensters ist folgender:


Stapel-
fenster

Sym-
bol-
leiste
Bild

(Werk-
zeuge
für
Seiten-
Layout)

Bildfenster

(verkleinerte
Bilddarstellung
für Layout-Steuerung)
 

Textfenster/Editorfenster

(Erkannter Text.
Unsicher Erkanntes
ist farbig hinterlegt
und kann korrigiert werden.)

Zoomfenster
(genauerer Ausschnitt des Bildfensters)
Bei Verwendung des Assistenten
kommt diese Aufforderung:
Wenige Fehler / Viele Fehler?     Das hat zur Folge:
  • Verabeitung möglich
  • Abhilfen werden vorgeschlagen

Rechtschreibprüfung

Bei Verwendung
des Assistenten
werden Sie gefragt:
Prüfen? Ja / Nein
Andernfalls können Sie
das Assistentensymbol
3 / Rechtschreibung
wählen.

Die Prüfung startet mit dem folgenden Fenster:

Rechtschreibung prüfen

Es wird ein Wörterbuch zu Hilfe genommen. Bei jedem unsicher erkannten Wort haben Sie die Wahl:

Wurde der Text richtig erkannt?

- Ja: Wählen Sie "Ignorieren" oder "Alle ignorieren" (gilt dann für weitere Vorkommen).
- Nein: Wenn ein Vorschlag passt, können Sie ihn auswählen und "Ersetzen" oder "Alle ersetzen" wählen (Letzteres gilt dann für weitere Vorkommen).

In jedem Fall können Sie den Text im mittleren Fenster korrigieren und "Bestätigen" wählen.

Wenn die Seite abgearbeitet ist, erscheint die Meldung "Rechtschreibprüfung ist abgeschlossen."

Speichern

Bei Verwendung des
Assistenten erscheinen
automatisch die Fenster
ähnlich wie unten
beschrieben.
Andernfalls wählen Sie das kleine Dreieck rechts neben dem Assistentensymbol "Speichern" ...

4 - Speichern

... und dann das Gewünschte.

Bei Auswahl von "Assistenten speichern..." erscheint der ...

Speicher-Assistent

Wird "In Datei speichern" gewählt, erscheint:

Text speichern unter ...

Überlegen Sie Ihre Auswahl für "Layout übernehmen". Wollen Sie ein eigenes Layout festlegen, ist es einfacher, die Seitengestaltung nicht zu übernehmen.

Wenn Sie weitere Seiten haben ...

... gehen Sie wieder zum Anfang des Kapitels "Ablauf der Texterkennung".

Beenden

verkleinerte Seitendarstellung Markieren Sie alle Seiten im Stapelfenster und löschen Sie sie, z. B. mit der Taste "Entf".
(Hierdurch werden die internen Arbeitsdateien gelöscht. Unterbleibt dies, stehen die Seiten beim nächsten Aufruf von FineReader weiterhin zur Verfügung.)

Beenden Sie FineReader.