synOCR

System Tasks synOCR v1.5.2

Keine Rechte zum Download
  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

geimist

Benutzer
Sehr erfahren
Maintainer
Add-on Developer
Registriert
04. Jan. 2012
Beiträge
5.998
Reaktionspunkte
1.744
Punkte
234
geimist erstellte eine neue Ressource:

synOCR - OCR und PDF-Management – mach deine Synology DiskStation zum papierlosen Büro

Was ist synOCR?

synOCR ist eine native App für Synology DSM. Damit kannst du einfach OCR (Texterkennung) auf PDF-Dokumente direkt auf den NAS anwenden, da Scans ja in der Regel zunächst nur aus einer Bilddatei bestehen. synOCR kann anschließend nach Tags und Datum in den Dokumenten suchen, diese nach einem individuellen Muster umbenennen und nach Kategorien, Tags oder Jahren in Ordner einsortieren. Durch Verwendung von Hardlinks entsteht auch kein erhöhter...

Erfahre mehr über diese Ressource...
 
  • Like
Reaktionen: guidovg und Yippie
Schwerpunkt liegt bei synOCR nicht beim Durchsuchen und Darstellen von Dokumenten, sondern auf der OCR-Funktion und dem regelbasierten Einsortieren. Entscheidender Unterschied: Alle Daten bleiben im Dateisystem und nicht in einer proprietären Datenbank.
 
geimist aktualisierte synOCR mit einem neuen Updateeintrag:

v1.5.2

⚠️ bekannte Probleme / Einschränkungen / known issues / limitations:​

Geräte mit einer ARM64 / aarch64 CPU werden mit dieser Version aufgrund von Python-Inkompatibilität derzeit nicht unterstützt❗
Devices with an ARM64 / aarch64 CPU are not supported with this release due to Python incompatibility at this moment❗

Folgende Funktionen erwarten dich mit dem...

Lese den Rest der Aktualisierung...
 
Stephan, ich hatte gestern ein ausgedrucktes DIN-A4-Blatt wieder eingescannt und danach SynOCR drüber laufen lassen.

OCR hat nur an einigen wenigen Textpassagen geklappt - der Rest wurde wohl einfach nicht als Text erkannt. Ich muss dazu sagen, dass die Scanvorlage hellblauen Text verwendet. Fehlermeldung gabs dementsprechend keine.

Hab dann heute ein anderes Dokument mit schwarzem Text gescannt und da ist alles wunderbar OCRt worden.

Liegt das möglicherweise an der Textfarbe? Ich muss noch hinzufügen, dass ich gestern meinen Dokumentenscanner Epson ES-C 380W mit neuer Firmware beglückt habe.

Gruß... Atze
 
Für die Erkennung ist allein OCRmyPDF zuständig. Wenn der Kontrast natürlich schwach ist, ist es auch die Erkennung. Du könntest versuchen, den Schwellwert für Schwarzweiß und Kontrast anzupassen, wenn es eine wiederkehrende Problematik bei dir ist.
 
Ok, wird sofort ausprobiert. Ich meld mich.

So, alles probiert. Ergebnis: Schärfeanpassung - Texterkennung unverändert.

Schwellwert SchwarzWeiß auf 1 und der Text wird komplett erkannt und OCRt. Allerdings werden die Grafiken leider auch schwarzweiß und sind übler Qualität.

Zurückgestellt auf "ohne Farbabpassungen" - gleiches Ergebnis wie am Anfang: nur wenige Wörter werden erkannt. Scheint also tatsächlich an der Druckfarbe zu liegen.

Ich versuch mal ein anderes Dockerimage.
 
Zuletzt bearbeitet:
Ne, mit allen drei Images (Deines und die beiden von jbarlow) das gleiche Ergebnis: Hellblauer Text scheint Pfui zu sein.

Egal - komm ich mit klar. Ist ja eh höchst selten.

Danke Stephan!
 
Ja, das Image ist nicht das Problem. Manche Quellen sind einfach undankbar.
 
  • Like
Reaktionen: atzebonn

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat