synOCR synOCR - GUI für OCRmyPDF

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

wow danke fürs schnelle Antworten =)
Scanner ... in zwei verschiedenen Speicherorten ablegen
Der Backupordner wäre keine Option? Wahrscheinlich möchtest du die fertig verarbeiteten Dokumente dafür haben.
Soweit ich weiß kann er das nur in einen Ordner ablegen außer man scannt zweimal, aber würde die fertigen Dokumente gern haben um z.B. IBAN-Nummern kopieren zu können.

@Struppix @geimist
Logfile file_processing.log
Stimmt das wäre auf jeden Fall eine Möglichkeit das Dokument zu überprüfen. Müsste man dann leider nur immer raussuchen.
Bei der Wildcard_rule würde so wie ich das verstehe dann keine Umbenennung geschehen oder? In Kombination mit dem Logfile könnte man das aber so probieren.

3. Postscript hat das Problem, dass es nur die letzte Datei sehen kann (wenn z.B. dein Quelldokument automatisch mittels Trennblatt gesplittet wurde).
Das heißt es würde Probleme geben, wenn ein Scan durch ein Trennblatt aufgeteilt wird in 2 Dateien, dann würde er nur die letzte Datei erkennen? Ein Einfluss, wenn mehrere verschiedene Scan-Dateien verarbeitet werden würde es dann nicht haben?
Aktuell nutze ich keine Trennblätter, könnte also wahrscheinlich mit der Einschränkung erstmal leben.


Edit: gerade getestet mit der wildcard_rule es wird die umbenannte Datei abgelegt. Das sieht auf dem ersten Blick super aus!
Super lieben Dank dafür!
 
Zuletzt bearbeitet:
  • Like
Reaktionen: Yippie
Bei der Wildcard_rule würde so wie ich das verstehe dann keine Umbenennung geschehen oder? In Kombination mit dem Logfile könnte man das aber so probieren.
Doch. Diese Regel sagt nur, dass jedes Dokument auch in dem Regeldefinierten Ordner verschoben wird. Da sich Regeln summieren, wird der Name ja noch durch andere Regeln komplettiert. Probiere es einfach mit einem Dokument aus.

Das heißt es würde Probleme geben, wenn ein Scan durch ein Trennblatt aufgeteilt wird in 2 Dateien, dann würde er nur die letzte Datei erkennen? Ein Einfluss, wenn mehrere verschiedene Scan-Dateien verarbeitet werden würde es dann nicht haben?
Die Postscriptfunktion wurde mal nur als Workaround für spezielle Wünsche eingebaut.
Aber ich muss mich da korrigieren: In der letzten Version habe ich die Schleifen umgebaut. Jetzt sollte postscript bei jeder Datei greifen.
 
Guten Morgen,
ich nutze seid heute synOCR und versuche mich erstmal zurechtzufinden. Ich habe eine Frage zur automatischen Ordnerüberwachung. Da ich DSM 7.3.2-86009 auf meiner DS423+ kann ich da nicht inotify-tools nutzen.
Wie löst Ihr das denn? Startet Ihr den Vorgang nun immer manuell?
 
Ich lass synOCR per Aufgabenplaner alle 2 Stunden einmal laufen. Das reicht mir und funktioniert bestens.
 
  • Like
Reaktionen: wolkentreiber
So genau ist das bei mir auch. Nur das ich einmal die Stunde eingestellt habe. Für meine Zwecke locker ausreichen.
 
Zuletzt bearbeitet von einem Moderator:
  • Like
Reaktionen: wolkentreiber
Sorry, falls ich die Lösung im Thread übersehen haben sollte, aber nach 3h vergeblichem Suchen und Versuchen schreibe ich mal hier hinein: Habe eine DS412+ mit neuester DSM 6, Docker, synOCR und inotofy-tools frisch installiert, mehrfach gebootet. Genutzt wird jbarlow83/ocrmypdf:latest. Ich starte synOCR über Aufgabenplaner als root und bleibe jetzt an folgender Stelle hängen:

- alle PDFs im Input Verzeichnis werden gelesen und nach ERRORFILES verschoben
- Anbei ein ErrorLog der Verbeitung zum PDF. Ich werde daraus nicht schlau

Besten Dank vorab für eure Hilfe,
Peter
 

Anhänge

Besten Dank schonmal an @geimist. Die Umkonfiguration des ocrmypdf images von latest auf 12.7.2 hat bei meiner Umgebung jedenfalls geholfen :) Dann lass ich das erstmal so laufen.
 
  • Like
Reaktionen: geimist
@geimist
Ich habe leider nach wir vor Probleme, das 95% aller Dokumente in meinem "ErrorFiles" Ordner landen, statt erfolgreich verarbeitet zu werden. Habe das Image auch schon von latest auf 12.7.2 umgestellt - selbes Ergebnis.

Aktuell wieder ein Beispiel-Log:
UPDATE - muss korrigieren.

Die Datei wird erfolgreich "gescannt" und im richtigen Ordner abgelegt.
Aber AUCH im Ordner ERRORFILES. Wieso das??

Erklärung Backup Verzeichnis
"Sofern hier ein gültiger Pfad eingetragen wird, werden die Originaldateien hier gesichert (wird ggf. erstellt).
Ist kein gültiges Verzeichnis hinterlegt, werden die Originaldateien endgültig gelöscht.
Verwende den vollständigen Pfad (z.B. /volume1/homes/username/scan/backup/)

Würde ich den Pfad bei mir rausnehmen, was würde dann mit Files passieren, die auf einen "error" ?
 

Anhänge

Zuletzt bearbeitet:
Wie ich in deiner Konfiguration sehe, hast du es ja so definiert:
BackUp directory: /volume1/synOCR/INBOX/XXX/ERRORFILES/

Das bedeutet, dass alle (ursprünglichen und unbearbeiteten) Quelldateien nach erfolgreicher Verarbeitung dort hin verschoben werden. Das dient als Sicherung, weil synOCR keine Originale löschen möchte. Beachte: Die Resultate von synOCR / OCRmyPDF sind immer Kopien. Daher hast du anschließend zwei Dateien. Backupdateien kann man sich aber automatisch anhand der Überzahl oder dem Alter löschen lassen.

Den Unterschied zwischen der Zieldatei und dem Backup (der ursprünglichen Quelldatei) kannst du z.B. anhand der Dateigröße erkennen - die sollten unterschiedlich sein.

Kommt es bei einer Datei zu einem Problem und es wird keine Zieldatei gefunden (z.B. bei einer verschlüsselten Quelldatei), wird die Quelldatei bei dir in den Ordner /volume1/synOCR/INBOX/ERRORFILES unterhalb des Inputortners inkl. Logfile verschoben. So erkennt man Probleme und es geht nichts verloren.

Ich hoffe, dass ich mich einigermaßen verständlich ausdrücken konnte.
Kannst du das Verhalten bestätigen?
 
Ja verstehe ich, aber gibt es denn keine Möglichkeit es so zu handeln:
Wenn Datei mit Errors durchlaufen wurde > verschiebe in den Ordner ERRORFILES
Wenn nicht > verschiebe die Datei in das Zielverzeichnis

Ich möchte nur eine Datei habe und keine 2 (sprich, die Kopie)
 
okay, das dachte ich mir und habe ich bereits gemacht.
ABER was passiert mit der Datei, wenn diese nun auf einen Error läuft? Bleibt diese dann einfach nur an Ort und Stelle?
 
Kommt es bei einer Datei zu einem Problem und es wird keine Zieldatei gefunden (z.B. bei einer verschlüsselten Quelldatei), wird die Quelldatei bei dir in den Ordner /volume1/synOCR/INBOX/ERRORFILES unterhalb des Inputortners inkl. Logfile verschoben. So erkennt man Probleme und es geht nichts verloren.
Dateien mit Fehlern werden unabhängig von der Backupkonfiguration behandelt.
 
Hallo,

ich habe leider seit kurzem das Problem, dass sich im SynOCR bestimmte Einstellungen nicht mehr speichern kann.

Wenn ich ein neue Profil anlegen will, wird es nicht gespeichert.

Hat jemand eine Idee dazu?

Ich habe es sowohl mit Version 1.5.0 und 1.5.2 versucht. Mit einer alten Version 1.4.5 läft es besser aber die ist natürlich nun schon sehr veraltet.

Meine Hardware: RS3614xs+, 8 GB Ram, DSM: DSM 7.1.1-42962 Update 92026-02-15 21_13_51-L__02_SynOCR_In – Datei-Explorer.png2026-02-15 21_14_17-L__02_SynOCR_In – Datei-Explorer.png

Ähnlich verhält es sich, wenn ich das Default-Profil nehme und das Feld "OCR Rename-Syntax" speichern möchte. Bei anderen Einstellungen z.B. Pfadnamen (Inbox) usw. funktioniert alles super.

2026-02-15 20_48_03-Greenshot.png2026-02-15 20_48_30-Greenshot.png2026-02-15 20_49_00-Greenshot.png


Ich habe auch schon mehrmals alles deinstalliert und neu draufgespielt. Leider bringt das keiner Verbesserung.

Gibt es irgendwelche Cache-Files, die man vielleicht löschen muss/könnte, um das Problem zu beheben?

Danke
 
Ich kenne solche Probleme bisher nur von dem Fall, dass man im Feld für die zu suchenden Tags einen Zeilenumbruch eingefügt hatte. Das zerstört dann die komplette Abfrage / Übertragung aus dem Browser zum speichern.
Wenn du das als Ursache ausschließen kannst, würde ich mir gern mal deine DB ansehen (Downloadbutton unten auf der Konfigurationsseite) und den genauen String, bei dem der Fehler auftritt.

Du kannst es mir vertraulich hier hochladen: Log-Up↑oad

Hast du beim Wechsel zwischen den Versionen das Backup jeweils wiederhergestellt?
 
Hi Stephan, hmm, zu 100% ausschließen kann ich das nicht. Es kann sein, dass es mir zu einem früheren Zeitpunkt "passiert" ist, es mich aber eben nicht gestört hat. Würde denn eine vollständige Deinstallation und anschließender Neuinstallation das Problem beheben oder was müsste man bei einer "zerstörten Abfrage" tun?
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat