OCRmyPDF in Docker zum Laufen kriegen

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

Status
Für weitere Antworten geschlossen.

Tuck

Benutzer
Registriert
06. Feb. 2021
Beiträge
4
Reaktionspunkte
0
Punkte
1
Hallo liebe Community,

ich habe mir vor kurzem eine DS220+ gekauft und würde gerne mein papierloses Büro u.a. mit OCRmyPDF vorantreiben. SynOCR kenne ich, habe aber mittlerweile schon die DSM 7, weshalb das vorerst nicht klappt.

Seit 2 Tagen lese ich die Dokumentation von OCRmyPDF und ich schaffe es nicht, den Container zum Laufen zu kriegen. An sich brauche ich nur einen Input- & Output-Ordner, umbenennen soll OCRmyPDF gar nicht. Leider finde ich nirgends die Information, welche Pfade, Ports etc. angelegt werden müssen, um das Dienstprogramm zu starten.

Als Alternative habe ich es auf dem Mac über Homebrew halb ans Laufen gebracht, habe aber kein funktionierendes Script gefunden, welches einen Ordner automatisiert, daher leider keine gute Alternative. :/

Über eure Hilfe, wie ich den Container zum Laufen kriege, wäre ich unglaublich dankbar!

Liebe Grüße
Tuck
 
Du kannst es übers Terminal (ssh auf die DS (ssh admin@NameDeinerDS), dann sudo -i) recht einfach konfigurieren. In meinem Beispiel schreibt der Scanner nach /volume1/temp und das fertige PDF wird nach /volume1/scanner geschoben. Den Wert für PUID ersetzt Du mit der ID eines Users, der Rechte auf die Verzeichnisse hat (Befehl dazu id <Benutzername>)

docker run -d --name OCRmyPDF --restart unless-stopped -v /volume1/temp:/input -v /volume1/scanner:/output -e OCR_ON_SUCCESS_DELETE=1 -e OCR_JSON_SETTINGS='{"rotate_pages": true, "skip_text": true, "language": "deu+eng+fra", "output_type":"pdf"}' -e PYTHONUNBUFFERED=1 -e PUID=1040 -e PGID=100 -e TZ=Europe/Berlin -it --entrypoint python3 jbarlow83/ocrmypdf:latest watcher.py
 
  • Like
Reaktionen: Tuck
Hallo Der Paul,

lieben Dank dafür! Ich werde mich gleich dransetzen und Rückmeldung geben, ob es geklappt hat.
 
Hallo Der Paul,

es funktioniert! Ich habe nur die Pfade abgeändert.

Aber ein komisches Phänomen habe ich da noch. In der File Station bewegen sich die Dateien in den Output, die Input-Dateien werden gelöscht. Mit meinem Drive-Client auf dem Desktop ändert sich da tatsächlich nichts. Ich sehe also noch die nicht OCR-ten PDFs, während der Output leer bleibt. Idee, wie man da Abhilfe schaffen kann?
 
Hallo Tuck,

ich habe das gleiche Problem wie du mit dem Drive-Client und gerade herausgefunden, dass es an dem Besitzer der Dateien liegt und der bei mit root und nicht der user des drive client ist. (Rechtsklick und Eigenschaften in der File Station öffnet das Menü.)

Hast du schon eine Lösung für dein Problem gefunden? Ich habe jetzt gesehen, dass synOCR mit GUI auch für DSM 7 verfügbar ist und mich nicht mehr mit der direkten Implementierung von OCRmyPDF beschäftigt.
In diesem Post gibt es alle Informationen dazu, falls dir das hilft: https://www.synology-forum.de/threads/synocr-gui-fuer-ocrmypdf.99647/post-974246
 
  • Like
Reaktionen: geimist
Status
Für weitere Antworten geschlossen.
 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat