synOCR synOCR - GUI für OCRmyPDF

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
5.525
Punkte für Reaktionen
1.360
Punkte
234
  1. jbarlow83/ocrmypdf:latest ist richtig. Grundsätzlich brauchst du das nicht mal zu machen, da das Script sich selber das richtige Abbild saugt.
  2. Einen Container brauchst du gar nicht zu erstellen. Das Script lädt den Container, führt ihn aus und danach ist er wieder weg.
  3. siehe Punkt 2.
  4. Sind die Pfade so vorhanden? Groß- und Kleinschreibung beachtet?

Wunsch für die Zukunft wäre ein Dienst der im Hintergrund läuft der permanten scan ob eine Datei im Imput ist un diese sofort ocr prüft. ;)
Für diesen Zweck habe ich ein kleines Script, welches über den Aufgabenplaner alle 10min ausgeführt wird. Das Script prüft das Input-Verzeichnis und bei enthaltenen Dateien führt es das Script von SynOCR aus.

Rich (BBCode):
cd /volume1/DEINORDNER/_INPUT
list=$(echo *)
if [ "$list" = "*" ] || [ "$list" = "@eaDir" ]
then
echo "Verzeichnis leer"
else
cd /usr/syno/synoman/webman/3rdparty/synOCR/
bash /usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh
fi
 
Zuletzt bearbeitet:

rabu

Benutzer
Mitglied seit
26. Sep 2013
Beiträge
278
Punkte für Reaktionen
2
Punkte
24
Wunsch für die Zukunft wäre ein Dienst der im Hintergrund läuft der permanten scan ob eine Datei im Imput ist un diese sofort ocr prüft. ;)

Hi, das funktioniert doch jetzt schon. Einfach die Codezeile aus der Hilfeübersicht nehmen und einen neuen Task im Aufgabenplaner anlegen. Zeit auf 1min stellen und schon läuft es rund.
/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh

Zeig mal bitte deine Konfig Seite als screenshot.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Also entweder ist im Pfad ein Fehler oder der SearchPräfix ist unpassend vorbelegt (den Beispielwert "SCAN_" habe ich in der aktuellen Version 0.13.0 schon herausgenommen).
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234

Für diesen Zweck habe ich ein kleines Script, welches über den Aufgabenplaner alle 10min ausgeführt wird. Das Script prüft das Input-Verzeichnis und bei enthaltenen Dateien führt es das Script von SynOCR aus.…

Wie rabu schon schreibt: Das sollte jetzt nicht mehr notwendig sein, da der Hauptlauf nur dann startet, sofern PDFs abzuarbeiten sind. Es entstehen also auch keine leeren Logs.
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
5.525
Punkte für Reaktionen
1.360
Punkte
234
Das sollte jetzt nicht mehr notwendig sein, da der Hauptlauf nur dann startet, sofern PDFs abzuarbeiten sind.
Ja, das hatte ich vergessen.
Mein Script stammt noch aus der Zeit davor und es ist Teil eines anderen Scripts, welches u.a. die Laufzeit protokolliert.
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
99
Punkte
134
Das Verhalten ist mir neu :confused:
Es gibt ein bekanntes Problem (das betrifft aber viele SPKs), dass das SPK nach einem Update nicht gestartet werden kann - man sieht nur das Icon mit Wartekreis. QTip sieht den dahinterliegenden Fehler im DSM. Hierbei ist es notwendig, die DSM-Seite nach einem Update einmal neuzuladen um das SPK verwenden zu können.

Ja, das ist mir bekannt. Nur ist hier bisschen anders mE - ich sehe keinen Wartekreis o.ä. - ich werde einfach eiskalt rausgekickt ;)

Mal den Cache gelöscht?
Seit wann gibt es das Verhalten - SPK Update oder DSM Update?
Inkognitofenster / anderer Browser probiert?

ad Cache) natürlich
ad Verhalten) Seit dieser Version (0.13.0) - seit SPK Update (DSM hab ich nach wie vor auf 6.2.1 - U4)
ad InkTab) nein
ad Browser) ja (EDGE, Opera und Chrome)

Ansonsten werde ich das Paket mal deinstallieren - nur wie kann ich die gesicherten Backups eig. wieder einspielen (mir noch gar kein "Restore"-Button aufgefallen? und jetzt nachsehen kann ich auch nicht ;))
 

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Also entweder ist im Pfad ein Fehler oder der SearchPräfix ist unpassend vorbelegt (den Beispielwert "SCAN_" habe ich in der aktuellen Version 0.13.0 schon herausgenommen).

ich hab das Ordner umbenannt ohne _ und im Programm auch das _ rausgelöscht. funktiniert trotzdem nicht.

ich denke auch es hat was mit dem Docker zu tun. oder der verbindung. kann ich das irgednwie testen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
… Ansonsten werde ich das Paket mal deinstallieren - nur wie kann ich die gesicherten Backups eig. wieder einspielen (mir noch gar kein "Restore"-Button aufgefallen? und jetzt nachsehen kann ich auch nicht ;))

Wie ich dir hier schonmal antwortete:
* Backup - was genau wird da gesichert? Die Einstellungen/Konfigs und interner Zeitplaner? Denn ein Restore-Button hab ich nicht gefunden? Wie wird das Ganze wiederherstellt?…
… Im Einstellungsdialog kannst du dir die Konfigurationsdatei entweder in den Quellordner exportieren, oder von dort auch importieren. 'BackUp' sollte sich doch nur noch im Paket selbst finden. Dort sind die Skripte hinterlegt, um Einstellungen und den Dateizähler mit HyperBackup sichern und wiederherstellen zu können. Oder meinst du etwas anderes? Der Zeitplan wird derzeit nicht gesichert …

Also entweder über die Button "Export" und "Import" in der Konfigurationsseite oder mit HyperBackup das Paket sichern (so wird auch die Statistik beibehalten).
Deine Datenstruktur bleibt natürlich unabhängig von der synOCR-Installation
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
ich hab das Ordner umbenannt ohne _ und im Programm auch das _ rausgelöscht. funktiniert trotzdem nicht.
ich denke auch es hat was mit dem Docker zu tun. oder der verbindung. kann ich das irgednwie testen?

Nein, da käme eine Fehlermeldung im Log. Da auf der Statusseite ein grüner Haken und keine Sanduhr als Icon ist, bedeutet das, dass synOCR keine abzuarbeitende PDF vor sich hat.
Mach doch mal bitte, wie schon von rebu angefragt, ein Screenshot von der Konfigurationseite, wo man "Allgemein" und "OCR Optionen und Umbenennung" sieht.
 

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Also entweder ist im Pfad ein Fehler oder der SearchPräfix ist unpassend vorbelegt (den Beispielwert "SCAN_" habe ich in der aktuellen Version 0.13.0 schon herausgenommen).

Es war das SearchPräfix mit dem SCAN_ hat das Problem verursacht

DANKE :cool:

Das mit dem Script schaue ich mir dann als nächstes an
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Sehr schön :)

Welches Script meinst du?
Wie gesagt: der Workarround von peterhoffmann wird in der aktuellen Version nicht mehr benötigt.
 

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Ich habe leider schon das nächste

ich habe synOCR auf 2 verschiedenen Synology Geräten installiert.

Gerät 1:
Admin funktiniert
Benutzer funktioniert

Gerät 2:
Admin funktiniert
Benutzer: FUNKTIONIERT NICHT

Geräte sind eigentlich komplett ident eingestellt nur unterschiedlicher Bauweise.

Das kommt wenn ich es als Benutzer öffne
2019-02-22 13_46_43-konnte nicht gefunden werden.jpg
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Ich habe den Fehler wahrscheinlich gefunden.

Kannst du mal bitte die 2 Benutzer auf den 2 DSen vergleichen?
Gehört der User, wo es funktioniert, zu den Administratoren und der andere, wo es nicht funktioniert, nicht?
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
99
Punkte
134
Also entweder über die Button "Export" und "Import" in der Konfigurationsseite oder mit HyperBackup das Paket sichern (so wird auch die Statistik beibehalten).
Deine Datenstruktur bleibt natürlich unabhängig von der synOCR-Installation

Pardon - danke für dein Geduld und den erneuten Hinweis ... ;)
 

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Ich habe den Fehler wahrscheinlich gefunden.

Kannst du mal bitte die 2 Benutzer auf den 2 DSen vergleichen?
Gehört der User, wo es funktioniert, zu den Administratoren und der andere, wo es nicht funktioniert, nicht?

Nein selbst beim Gerät 1 wo es funktioniert hat der Benutzer keine Admin rechte.
 

Cyberbob19

Benutzer
Mitglied seit
05. Mai 2011
Beiträge
231
Punkte für Reaktionen
0
Punkte
22
Hallo an alle,

zunächst einmal vielen Dank @geimist für deine Leistung/Arbeit!

Ich verfolge das Thema Dokumente auf dem NAS ablegen und per OCR durchsuchbar zu machen schon länger und habe schon einiges gelesen, wie andere das so machen.

Mein Problem ist nun (wie Hafer in einem vorherigen Post bereits schrieb:
Befinden sich die durchsuchbaren PDF jedoch auf einem Netzlaufwerk der DS, so kann man zwar mit universal search suchen, aber eben nur von der Weboberfläche des DSM aus. Von Windows aus funktioniert allerdings nur die Suche über die Dateinamen, keine Suche über einen Vollindex, weil der Windows-Indizierungsdienst Netzlaufwerke ignoriert. SHIT!

Verwendet hierfür jemand ein Tool, wenn ja, welches, bzw. könnte einen Tipp geben wie man das Problem lösen könnte?

Ich habe es bereits mit einem Drittanbieter Tool (search my Files) probiert... klappt damit leider auch nicht.

Wäre für Ideen/Ratschläge sehr dankbar!

Gruß
Bob
 

lord_zunami

Benutzer
Mitglied seit
15. Feb 2019
Beiträge
29
Punkte für Reaktionen
0
Punkte
1
Kurz eine Geschichte von mir was ich vorhabe und wie ich es gelöst habe.

Ich verwende das Tool um fotografierte Akten zu archivieren. Meine Frau und Kinder machen genau das selbe.
darum bin ich auf synOCR gestoßen denn es muss easy sein sonst verstehen es meine Kinder nicht.

Jetzt habe ich einen Scan Ordner erstellt wo alle darauf zugreifen konnten und mit dem Tool synOCR starten.
So damit habe ich einen kleinen Familien Kleinkrieg gestartet weil sie es nicht verstanden haben. Warum muss ich da in das Tool hinein geht - das nicht leicht usw...

LÖSUNG:
ich habe auf der Synology den Ordner behalten. Habe daraus einen Team Ordner erstellt.
Im Synology Aufgaben habe ich das durchsuchen des Ordner auf 5min gestellt.
Ich habe es im Drive freigegeben: Inbox bearbeiten - Outbox bearbeiten - Log Ansicht - Backup Ansicht
Jetzt kann sich jeder den Ordner im Windows oder Mac synchronisieren.
Über das App mit PDF Dateien hinterlegen
und jeder kann sich die Dateien in der Outbox abholen.

Darum Danke für das Tool auf der Admin Seite

Eines meine Kinder hatte dafür trotzdem eine tolle Idee.
Warum gibt es kein OCR Tool das mit Drag and Drop funktioniert.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat