synOCR synOCR - GUI für OCRmyPDF

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

Ja, das hat geholfen - jetzt funktioniert es wieder und die Datei ist 25 KB klein! 😀
Toll, vielen Dank!
Woran hat es denn gelegen?
 
Die Slider für die Farbanpassung speichern in der DB im Falle von deaktiviert den Wert 1.0, geprüft wird aber im Skript später auf 1. Und wenn es ungleich 1 ist, wird die Farbanpassung vorgenommen. Im Fall von 1 bleibt das Ergebnis zwar unverändert, die Datei wird aber neu berechnet und weicht in der Dateigröße von der Quelldatei ab. Deshalb wurde sie bei dir nicht kleiner.

Vielen Dank für deine Geduld :)
 
Ah, ok. Alles klar.
Vielen Dank für die schnelle Hilfe und noch einmal tausend Dank für das tolle Programm!
 
  • Like
Reaktionen: geimist
Guten Morgen 🌞

seit langem liebäugel ich damit SyoOCR samt GUI zu installieren, in Kürze wird es soweit sein.

Ich möchte das Rad nicht neu erfinden und Fehler/Probleme vermeiden, die bereits gelöst wurden.
Seit 2019 sind hier über 5.000 Beiträge zusammengekommen – sicher mit vielen hilfreichen Infos.
Muss man das wirklich alles lesen?
Gibt es vielleicht eine aktuelle Zusammenfassung oder ist die Einführung regelmäßig gepflegt und ausreichend?
 
Ja, du musst vorher alles lesen - das wird bei der Installation abgefragt 🤣

Der Startbeitrag ist aktuell.
Hilfreich sind bestimmt auch das WIKI, die Videos von @Struppix und beim tieferen Einsteigen in RegEx-Regeln dann auch sein YAML-Editor.

Entscheidend ist, dass du eine kompatible DS hast (sind heute fast alle) und das Docker (bzw. der Container Manager) installiert ist.
In der GUI hast du auch neben jedem Formularfeld ein kleines Info-i mit Hilfetexten zu dem aktuellen Punkt.

Am besten du installiert es und siehst dann, welche Fragen aufkommen. Wir helfen dir hier gerne :)
 
Hallo Steven, regelmäßig gepflegt klingt echt total gruselig. Leider muss ich gestehen, dass ich das Wiki seit Längerem nicht mehr geupdated habe. Auch das Video zum Update von synOCR steht noch aus.
Nach ein paar "kleineren" medizinischen Umbauten seht Ihr mir das bitte nach. Irgendwie sind dieses und das letzte Jahr definitiv auf meiner Streichliste.

An der Stelle habe ich eine Bitte an alle unseren User, die mit einer YAML-Datei arbeiten. Ich bin eigentlich schon recht lange in den Endzügen für eine neue Version des Editors.
Dieser ist dann zweisprachig Englisch/Deutsch und wird eine Art Sammlung/ Bibliothek von beliebigen RegEx Regeln beinhalten. Da die Anzahl an Regeln doch noch sehr überschaubar ist, würde ich EUCH bitten, mir Eure Regeln zu schicken, damit ich sie mit aufnehmen kann. Ob kompliziert oder einfach ist völlig egal. Ein anderer User wird sich sicher darüber freuen...

Zum Schluss, da ich den Editor unter der Haube komplett umgebaut habe, würde ich mich über 1, 2 Tester die kommenden Tage freuen. Wer Interesse hat, bitte kurz per PN melden. Dauert noch ein paar Tage. Ich hoffe das zu schaffen, bevor ich das nächste Mal auf den Tisch muss.
Karsten
 
Wäre ich nicht Out of Home für 14 Tage wäre ich dein Tester ... Schade
 
  • Like
Reaktionen: Struppix
regelmäßig gepflegt klingt echt total gruselig.

Ja, verstehe ich voll und ganz.

Und in der Regel sucht man in einem Forum ja auch nach bestehenden Lösungen für bereits bestehende Themen und Probleme.

Das Rad wird dabei oft aufs Neue erfunden, weil so die hilfreiche Beiträge unter Tausenden erst ans Licht kommen, wenn es eigentlich schon zu spät ist.
Vorbeugend gegen Probleme sind die in zig Tausend Beiträgen verstreuten Schätze leider kaum zu gebrauchen.


Frage an Radio Eriwan:
Stimmt es, dass man sich durch zehn Minuten Lesen von Manual und Dokumentation viel Arbeit ersparen kann?
Antwort von Radio Eriwan:
Im Prinzip ja – aber das würde das Erfolgserlebnis nach fünf Stunden Trial and Error verderben.
 
Zuletzt bearbeitet:
  • Like
  • Haha
Reaktionen: Yippie und Struppix
Guten Morgen,
danke Holger, und schön geschrieben Steven. Von dem Sender habe ich seit Jahren nichts gehört, schön. Ob ich den Editor in 2 Wochen auf die Kette bringe... Ich weiß mal nicht.
Also das Wiki schreibt ja nichts falsches. Und jedes Detail kann man nicht erfassen und beschreiben. Dafür haben wir ja unser Forum. So wie Stephan schreibt, einfach fragen.
Karsten
 
  • Like
Reaktionen: wegomyway
Hallo zusammen,

ich schlage mich nun seit mehreren Wochen mit einem synOCR-Problem rum und egal, was ich versuche, ich bekommen es nicht final gelöst.

Ich bekommen sporadisch folgende FM:
OCRmyPDF-LOG:
docker: Error response from daemon: Conflict. The container name "/synOCR" is already in use by container "d14ae9813d274f2d381a7c9dc0319c8a1882ab9658ab5a8c3be4c46d88ec7f37". You have to remove (or rename) that container to be able to reuse that name.
See 'docker run --help'.
OCRmyPDF-LOG-END

Vorher lief SynOCR viele Monate und ohne Probleme. Dann musste ich leider einen Laufwerksdefekt beheben und seit dem habe ich es. Die Container-ID ("d14ae9813d274f2d381a7c9dc0319c8a1882ab9658ab5a8c3be4c46d88ec7f37") ändert sich dabei natürlich laufend.

Ich habe bereits folgendes versucht:
- SynOCR deinstallieren und neu installieren

- Docker deinstallieren und neu installieren (da ich keine anderen Container verwende)
- Docker zu bereinigen (zuvor habe ich synOCR wieder deinstalliert)...
- docker ps -a (da kommt natürlich keine Ausgabe, es sei denn, dass der Verarbeitungsprozess gerade läuft)
CONTAINER ID IMAGE COMMAND CREATED STATUS PORTS NAMES

- docker image ls
REPOSITORY TAG IMAGE ID CREATED SIZE
jbarlow83/ocrmypdf v12.7.2 2fa50c382164 3 years ago 629MB

- sudo docker rmi 2fa50c382164
Untagged: jbarlow83/ocrmypdf:v12.7.2
Untagged: jbarlow83/ocrmypdf@sha256:4ffa5bf2adb291f9482cb872b75e720c5c4c893ed9c8577880230e9f90bf0a19
Deleted: sha256:2fa50c3821646756a1cda78b0cf4a45d123474178aaad6b3fc8839233f1e9518
Deleted: sha256:8288080133a2a95a512e3ddd6d487497059ee3e60e3017043eb8f8a7ae051231
Deleted: sha256:bd7b3199021bc94f48eb5029e9660fa2bfbe0df3c550edd3dcb41cb53c2a327d
Deleted: sha256:d8e58550747a08f63c98e8fbab00cb645d10a0643453ca84213f189f4026f3ba
Deleted: sha256:842d9d4c63331af24e8a102645b4fa50b0265b710b105b3254899399f762a9f8
Deleted: sha256:959e90233a355fa2633d7e92d08865fb85c10396814d97264c9a82bcaa434127
Deleted: sha256:895526546741906f6c58ad02424d994f39f748dff8fa4f75b0e3ef5ebf848129
Deleted: sha256:e48107001d1acc654a0e88968293838eda9913db502fd5accb466fd0a418be08
Deleted: sha256:7334583ce8a6b16d33d448be36cd2e489b20d77d550fa571a894e4be97fb463f
Deleted: sha256:10af6ebcba2b7773c918ef6dc18e42fbccc8648d8dff2c23291364f7bf884bc1
Deleted: sha256:d425401e662d1c7da9298053fd999d60beb99c38add14d29bc92b89ebc9b5101
Deleted: sha256:a53f248ffa7f9cbc5d8b560ded8f0433685fa6983ac1b605f62b6312553cf382
Deleted: sha256:14636cce64eacda8aabad5a94446b86d5e69b7a00d798f4c4bbf920bad3e75ed


Ich muss vorwegnehmen, dass ich dieses Problem schon mal hatte (vor ca. 1 Jahr) und damals habe ich im Netz etwas gefunden, womit ich das Problem beheben konnte. Leider finde ich das nicht mehr. Es ging in etwa so, dass man über die Konsole mit sudo-Rechten in einen docker Ordner ging und dort gezielt die Dateien mit der o.g. ID (e.g. d14ae9813d274f2d381a7c9dc0319c8a1882ab9658ab5a8c3be4c46d88ec7f37) löschen musste. Danach lief dann wieder alles sauber und zwar Monate lang.

Ich verwende auch INOTIFY-Tools für die automatische Ordnerüberwachung.

Hat jemand eine Idee, was ich noch tun könnte, um das Problem nachhaltig zu lösen?

Beispieldatei und Logs habe ich mal beigefügt.

Vielen Dank
 

Anhänge

Der Fehler tritt auf, wenn synOCR aufgerufen wird, obwohl es bereits läuft. Das sollte eigentlich unterbunden sein und wundert mich entsprechend.
Die Container von synOCR ist nur temporär, d.h. nach Beendigung des Tasks werden sie gelöscht. Wenn nicht gerade Docker abstürzt oder ein Stromausfall ist, sollten die nicht übrig bleiben.
Benötigst du die Verzögerung von 3 Sekunden zwingend? Um das als Ursache auszuschließen, könntest du die mal auf 0 setzen.
 
Zuletzt bearbeitet:
Hi Stephan,

nein, ich brauche die Wartezeit nicht zwingend, hatte aber bisher auch noch nie Probleme damit. Ich habe es mal rausgenommen und beim ersten Versuch, hat alles geklappt (kein Fehler).

Problem ist bzw. war aber, dass der Fehler sporadisch immer wieder mal auftritt aber ich behalte es jetzt mal im Auge und schreibe dann ggfls. wieder.

Danke dir erstmal für deine Unterstützung.

Grüße Martin
 
Bitte geb mal in einiger Zeit Feedback, wenn du denkst, dass es so besser geht.
Dann Werde ich mir die zugrundeliegende Routine nochmal genauer ansehen.
 
Mache ich gern. Ich behalte das im Auge.

Ich hatte die Wartezeit (3 s) eingestellt, da ich dem Scanner (ScanSnap ix1600) gerade bei großen Dokumenten (wenn viele Blätter auf einmal gescannt werden) etwas Zeit geben wollte, die Datei vollständig zu speichern.
 
Wenn es der ScanSnap braucht, dann ist es ja genau dafür. Ich habe jetzt auch mal ein Delay bei mir aktiviert und werde beobachten.
 
EDIT:
Es wäre noch interessant, ob es gerade bei mehrseitigen Dokumenten zu diesem Problem kommt. In dem Fall solltest du vielleicht gerade mal mit einem höheren Delay arbeiten, damit die Dokumente fertig übertragen sind (je nach Dauer des Scanvorgangs vielleicht 15, 20 Sekunden oder mehr).
 
Hast du zusätzlich zur gestarteten Ordnerüberwachung noch die Aufgabenplaner aktiv?
 
Kann es sein, dass durch den früheren Defekt am Volume und die anschließende Neuinstallation von synOCR Teile der alten Installation übriggeblieben sind und sich nun mit der "neuen" Installation in die Quere kommen?

In welchen Ordner werden die Installationsdateien abgelegt?

Wenn ich z.B. synOCR deinstalliere, Docker ebenfalls deinstalliere, könnte ich nachsehen, ob alles sauber entfernt wurde.
 
Hast du zusätzlich zur gestarteten Ordnerüberwachung noch die Aufgabenplaner aktiv?
Ja, die Aufgabenplanung hat zwei aktive Jobs. Warte mal, ich habe gerade gesehen, dass zweimal der gleiche Befehl ausgeführt wird....
=> "/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh start"
Ich lösche mal eine Aufgabe und versuche es noch mal.
 
  • Like
Reaktionen: geimist

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat