So kratzen Sie Text aus einem Bild in Chrome

Für gewöhnlich setzt man OCR-Software (Optical Character Recognition) ein, um Texte aus Bildern zu gewinnen. Doch ab Google Chrome Version 76 gibt es eine experimentelle Funktion, die es ermöglicht, Text direkt aus Bildern zu "kratzen", ohne zusätzliche Programme zu benötigen.

Der Einsatz von OCR zur Texterkennung ist rechenintensiv. Allerdings unterstützen Hardwarehersteller die Formerkennung bereits seit geraumer Zeit.

Hier kommt die Formerkennungs-API ins Spiel. Diese basiert auf der Hardwarebeschleunigung des Geräts, auf dem sie ausgeführt wird. Die API ist in der Lage, Barcodes wie QR-Codes, sowie Gesichter und Texte zu erkennen. Weitere Informationen zum Projekt finden Sie auf der Webseite des Entwicklers. Dort wird detailliert auf die Funktionsweise der API eingegangen. Mehr zur Texterkennung können Sie auf der Webseite der Web Incubator Community Group erfahren.

Um diese Funktion nutzen zu können, muss ein experimentelles Flag in Chrome aktiviert werden. Beachten Sie, dass die Aktivierung von Flags in Chrome://flags das Verwenden von unfertigen Funktionen bedeutet, die nicht auf allen Geräten getestet wurden und sich daher unvorhersehbar verhalten können. Es kann zu Fehlern kommen, daher ist Vorsicht geboten, wenn Sie mit den verfügbaren Flags experimentieren.

Für diese Anleitung wird ein Windows-PC verwendet, aber die Vorgehensweise sollte auf allen Plattformen, einschließlich mobiler Geräte, identisch sein.

Starten Sie Chrome, geben Sie `chrome://flags` in die Adressleiste ein und drücken Sie die Eingabetaste. Geben Sie dann „Experimentelle Webplattform“ in die Suchleiste ein.

Alternativ können Sie auch direkt `chrome://flags/#enable-experimental-web-platform-features` in die Adressleiste eingeben und die Eingabetaste drücken, um direkt zum entsprechenden Flag zu gelangen.

Klicken Sie anschließend auf das Dropdown-Menü neben dem Flag „Experimentelle Webplattform“ und wählen Sie „Aktiviert“ aus.

Damit die Änderungen wirksam werden, ist ein Neustart von Chrome erforderlich. Klicken Sie dazu unten auf der Seite auf die blaue Schaltfläche „Neu starten“.

Nach dem Neustart von Chrome öffnen Sie https://copy-image-text.glitch.me/, um ein Bild mit dem zu extrahierenden Text hochzuladen. Klicken Sie auf „Datei auswählen“.

Wählen Sie die gewünschte Bilddatei von Ihrem Computer aus und klicken Sie auf „Öffnen“.

Obwohl Sie ein Bild auf die Website "hochladen", kann dieses Werkzeug auch offline verwendet werden. Nach dem ersten Aufruf der Seite werden alle benötigten Ressourcen im Cache gespeichert.

Nach dem Hochladen der Datei klicken Sie auf „Senden“.

Die Seite wird mit dem extrahierten Text neu geladen. Sie können den Text jetzt von der Webseite kopieren und in einen beliebigen Texteditor oder eine Textverarbeitungssoftware einfügen.

Es ist wichtig zu beachten, dass die Funktion noch nicht ganz ausgereift ist. Wie im obigen Bild zu sehen, wurde nur etwa die Hälfte des Dokuments hochgeladen und gescannt. Diese Probleme sollten jedoch mit der Zeit behoben werden.