OCR-Dokumente online mit ABBYY FineReader

Wenn Sie papierlos arbeiten, benötigen Sie eine einfache Möglichkeit, Ihre gescannten Dokumente durchsuchbar zu machen, sodass sie mehr als nur statische Bilder Ihrer Papierdokumente sind. Wir haben bereits nach Möglichkeiten gesucht, Dokumente in Anwendungen wie Adobe Acrobat, PDFPen und Google Drive zu OCR-Dokumenten zu machen. Obwohl jede dieser Apps Text in Ihren Dokumenten erkennen kann, ist dies nicht deren Hauptfunktion.

Einer der bekanntesten OCR-Entwickler ist ABBYY, der viele verschiedene papierlose Verwaltungsprogramme erstellt. In diesem Tutorial zeige ich Ihnen, wie Sie mit der Web-App FineReader und der OCR-Technologie PDFs, Scans und andere Bilddateien in bearbeitbaren Text konvertieren können.

Der ABBYY FineReader-Vorteil

Obwohl die Online-Version bei weitem nicht so leistungsfähig ist wie die Desktop-Version, ist ABBYY FineReader Online möglicherweise der leistungsfähigste Online-OCR-Dienst, der derzeit verfügbar ist. 

Vorverarbeitung

ABBYY FineReader nimmt den Großteil der Arbeit weg, die erforderlich gewesen wäre, damit OCR in einem anderen Dienst erfolgreich sein kann, da die Vorverarbeitung in der App selbst erfolgt. ABBYY FineReader korrigiert Bildverzerrungen wie Seitenausrichtung und Rauschen, bevor der Scanvorgang gestartet wird. Natürlich sind Aspekte wie Helligkeit und Bildqualität vom Benutzer abhängig, aber auf Seiten des Benutzers ist keine weitere Bearbeitung erforderlich.

Der Scanvorgang

Nach der Vorverarbeitung unterteilt ABBYY FineReader das Dokument in Elemente wie Tabellen, Bilder und Textblöcke, bevor es Zeilen, einzelne Buchstaben und Wörter erkennt. Die Technologie bestimmt dann das Verhältnis aller Eigenschaften der Seite zueinander. Dadurch wird sichergestellt, dass nicht nur der Text im Dokument, sondern das gesamte Layout der Seite selbst korrekt repliziert wird.

Sprachunterstützung

ABBYY FineReader Online unterstützt derzeit 42 Sprachen, auch solche mit nicht lateinischen Zeichen wie Hebräisch und Koreanisch. Für 37 dieser Sprachen gibt es eine Wörterbuchunterstützung, die eine noch genauere Wiedergabe ermöglicht, indem erkannte Wörter in mindestens einem Wörterbuch überprüft werden. Der Dienst kann OCR auf Dokumente mit bis zu drei verschiedenen Sprachen gleichzeitig anwenden.

Die vollständige Liste der unterstützten Sprachen für ABBYY FineReader Online.

Neben der Sprachunterstützung kann der Dienst auch alte Texte in deutscher und lettischer Sprache scannen, die in schwarzen Buchstaben geschrieben wurden. Damit ist ABBYY FineReader Online eine praktikable Option für die OCR von historischen Dokumenten. 

Die Kosten

Ein Service, der so mächtig ist, kommt nicht ohne Preis. OCR bei ABBYY FineReader Online ist nicht allzu teuer: Seitige Gutschriften kosten zwischen 3 und 10 US-Dollar für jeweils 20 bis 200 Page-Gutschriften. Wenn Sie sich für den Dienst anmelden, erhalten Sie jedoch 20 Credits kostenlos.

Der OCR-Prozess

Sobald Sie sich bei Ihrem ABBYY FineReader Online-Konto angemeldet haben, werden Sie zur Upload-Seite weitergeleitet. 

Fertig machen

Suchen Sie zunächst nach dem Dokument oder Bild, das Sie hochladen möchten, und stellen Sie sicher, dass ABBYY FineReader OCR für Ihre Datei unterstützt. Der Dienst unterstützt OCR für die Dateien PDF, .jpg, .png, .bmp, .pcx, .dcx, .tif, .gif und .djvu. Die maximale Dateigröße beträgt 30 MB. 

Spitze: Um optimale Ergebnisse zu erzielen, sollten Sie sicherstellen, dass Ihre Datei von hoher Qualität ist und die Textgröße mindestens 9 oder 10 Punkte beträgt. 

Wenn Sie ein physisches Dokument OCR machen möchten, verwenden Sie einen Hardwarescanner wie Doxie oder eine mobile App, um das physische Dokument in ein ABBYY FineReader-kompatibles Dateiformat zu konvertieren.

Das Dokument hochladen

Wenn Ihr Dokument zum Hochladen bereit ist, klicken Sie auf Hochladen Taste unter der Laden Sie eine zu bearbeitende Datei Feld. Finden Sie Ihre Datei in der Finder-Fenster, und klicken Sie auf Öffnen. Ich würde empfehlen, das zu deaktivieren Senden Sie mir einen Download-Link per E-Mail Ein Feld direkt unter dem Dateifeld ermöglicht den einfachen Zugriff auf das neu erstellte Dokument, nachdem es OCR-Code erhalten hat. Die hochgeladene Datei erscheint in der Wählen Sie die zu verarbeitenden Dateien aus Feld ein paar Abschnitte unten.

Wählen Sie eine Datei zum Hochladen aus.

Definieren Sie als Nächstes die Sprachen Ihres Dokuments unter Wählen Sie die Sprache (n) Ihres Dokuments Feld. Blättern Sie durch die Liste, bis Sie die Sprachen Ihres Dokuments finden. Wenn Sie mehr als eine haben, wählen Sie die zusätzlichen Sprachen aus, indem Sie die Taste gedrückt halten Befehl Taste, wenn Sie einen Mac verwenden, oder die Steuerung Taste, wenn Sie einen PC verwenden, und klicken Sie auf.

ABBYY FineReader Online unterstützt OCR für bis zu drei Sprachen in einem Dokument.

Wenn Sie ein älteres Dokument scannen, das in schwarzen Buchstaben festgelegt wurde, klicken Sie auf Hyperlink rechts neben der Sprachauswahlbox. Die Sprachliste ändert sich und bietet Ihnen die richtigen deutschen und lettischen Optionen für die OCR.

Dann gehe zum Wählen Sie ein Ausgabeformat In diesem Feld können Sie das Format auswählen, in das die Datei OCR übertragen wird. Derzeit kann ABBYY FineReader Online die Dateien als Microsoft Word oder Excel (sowohl im Format 97-2003 als auch als neue Version), als Open Office-, PDF-, RTF- oder als Nur-Text-Dokumente exportieren. Wählen Sie aus dem Dropdown-Menü das Format aus, in das das endgültige Dokument konvertiert werden soll. 

Wählen Sie ein Ausgabeformat aus dem Dropdown-Menü.

Spitze: Achten Sie bei der Auswahl Ihrer Dokumentausgabe auf Tabellen, Diagramme und andere Bilder, die sich möglicherweise in Ihrem Eingabedokument befinden, da das Textverarbeitungsprogramm sie möglicherweise nicht richtig verarbeiten kann und schlechte Ergebnisse liefert.

Vergewissern Sie sich, dass die Dokumente, für die Sie OCR erstellen möchten, im Kontrollkästchen aktiviert sind Wählen Sie die zu verarbeitenden Dateien aus Feld. Drücken Sie jetzt die Erkenne und ABBYY FineReader beginnt mit der OCR. 

Drücken Sie Erkenne um den OCR-Prozess zu beginnen.

Das Dokument bearbeiten

Nach dem Drücken Erkenne, Sie werden zu der weitergeleitet Aufgabenverlauf Auf dieser Seite können Sie den Fortschritt des OCR-Dokuments überprüfen. Je nach Größe der Datei kann OCR einige Sekunden bis einige Minuten dauern. 

Die Verarbeitung kann zwischen einigen Sekunden und einigen Minuten dauern.

Wenn die Verarbeitung abgeschlossen ist, können Sie Ihr Dokument in dem von Ihnen ausgewählten Format herunterladen und das Dokument direkt von der Web-App nach Google Drive, Evernote und Dropbox exportieren. Sie können auch die Qualität des OCR-Jobs bewerten, wodurch ABBYY seine Produkte verbessern kann. 

Sobald die Verarbeitung abgeschlossen ist, können Sie das Dokument herunterladen oder direkt in einen Cloud-Service exportieren.

OCR-Dokumente verbleiben zwei Wochen auf dem ABBYY FineReader-Server, bevor sie automatisch gelöscht werden. 

Machen Sie sich jetzt an die Arbeit!

ABBYY FineReader Online bietet eine einfache Möglichkeit, komplizierte Dokumente im Internet zu kostengünstigen OCR-Texten zu erstellen. Es ist zwar nicht vollkommen perfekt, wenn es um Bilder und andere Stilelemente geht, aber es übersetzt Text auch in mehrsprachigen Dokumenten fehlerfrei in viele verschiedene bearbeitbare Dateiformate. 

Wenn Sie Probleme mit OCR in ABBYY FineReader Online haben oder Gedanken oder Bedenken zu OCR haben oder generell papierlos sind, lassen Sie unten einen Kommentar!