synOCR synOCR - GUI für OCRmyPDF

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Hast du die selbst angelegt? Standardmäßig ist ja nicht vorhanden.
Nein. Dachte die wurde mit dem Paket Docker eingerichtet und habe sie mit den Rechten versehen, da ich den Hinweis in deiner Hilfe gelesen habe. Aber der bezieht sich nur auf die Ordner, richtig?

Da hast du mir ja eine ganz schön harte Nuss hingelegt …
Ja das kann ich gut :ROFLMAO:

Nochmal alle neu gemacht und andere Ordner verwendet, nun das
1674504267781.png

und das. Die rote 1 heißt, er ist noch nicht fertig?

1674504619156.png

Kann es sein, dass Umlaute Ärger machen? Mein alter Ordner Verträge ging nicht. Mit dem Ordner "Test" funktioniert es scheinbar.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.389
Punkte für Reaktionen
1.206
Punkte
234
Sehr schön, das freut mich sehr. :)
Nein, Umlaute sollten keine Probleme bereiten. Ich habe es gerade vorsichtshalber nochmals mit deinem Pfad getestet.
Ich hatte aber schon manchmal im DSM mit Umlauten Probleme und das ist auch Synology bekannt. Teilweise werden Dateien / Ordner in Unicode NFD abgelegt, was dann zu Problemen führen kann. Ich beobachte das meistens beim Upload über die Filestation. Man erkennt es u.a. daran, dass beim Umbenennen ein Umlaut scheinbar aus zwei Zeichen besteht. Würdest du z.B. das ä aus Verträge löschen wollen und setzt den Curser dahinter, dann löscht es beim 1. Backspace lediglich die Punkte über dem ä und beim 2. Backspace das verbliebene a. Schreibt man dann in diesem Zusammenhang ein ä, ist es auch korrekt gespeichert. Man kann Dateinamen auch per Skript von Unicode NFD zu Unicode NFC konvertieren. Vielleicht liegt die Ursache ja hierin.
 
  • Like
Reaktionen: c0smo und Tommes

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.151
Punkte für Reaktionen
1.115
Punkte
314
Um diesen und weiteren, oben angesprochenen Problemen aus dem Weg zu gehen, bin ich mittlerweile dazu übergegangen, auf Umlaute, Leer- und Sonderzeichen (bis auf - und _) in Ordner- und Dateinamen möglichst zu verzichten. Grade wenn man sich zwischen verschiedenen Welten wie Linux, Windows, MacOS etc. bewegt, macht das durchaus Sinn und schont obendrein die Nerven.
 
  • Like
Reaktionen: c0smo

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Kann ich synOCR eigentlich auch direkt im Browser aufrufen oder muss ich immer den Weg über die DS gehen?
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.151
Punkte für Reaktionen
1.115
Punkte
314
Solang du am DSM angemeldet bist, kannst du synOCR auch in einem neuen Fenster bzw. Tab öffnen. Das kannst du entweder aus dem DSM heraus aufrufen, indem du mit einen Rechtsklick auf das synOCR Icon, im aufklappenden Kontextmenü „Im neuen Fenster öffnen“ wählst. Oder du gibts einfach in die Browser-Adressleiste folgende Adresse ein…

https://[IP-DEINER-DS]:5001/webman/3rdparty/synOCR/index.cgi

…welche du natürlich mir der IP DEINER DS aufrufst. Solltest du nicht am DSM angemeldet sein, wird der Aufruf von synOCR scheitern. Das soll so sein und ist so gewollt.
 
  • Like
Reaktionen: geimist und c0smo

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Perfekt, danke. So kann ich am Handy schon ein wenig rumspielen und testen.
 

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Alles gut, soviel Wissen hab ich intus 👍😉
 
  • Like
Reaktionen: Tommes

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.151
Punkte für Reaktionen
1.115
Punkte
314
Jo! Oder mit einem anderen Port als 5000, wenn du den Standard-http-Port geändert hast. Ham wir jetzt alle Eventualitäten ausgeschöpft?
 

Monacum

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
03. Jan 2022
Beiträge
2.054
Punkte für Reaktionen
902
Punkte
204
Kein Grund, direkt unfreundlich zu werden. c0smo hat zu diesem Thema auch schon Fragen gestellt, bei denen ich die Lösung eigentlich für selbstverständlich halte, obwohl ich deutlich weniger Erfahrung mit Synology habe als ihr, aber es geht jeder mit einem unterschiedlichen Wissen an die ganzen Geschichten ran. Da kann man sich so einen Kommentar verkneifen, wenn jemand nur helfen möchte — jeder steht mal auf beiden Seiten bei diesen Fragen. Danke.
 

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Ich wusste das sowas zurück kommt, trotz meiner Smileys. 😂🙈
Das war absolut nicht unhöflich von mir angedacht. Ich bin für jede Hilfe dankbar, auch wenn ich hier mehr Beiträge habe oder sonst was. Der größte Teil beruht hier auf meinen beruflichen Erfahrungen in der Sicherheitsbranche. Die DS läuft nur nebenher und ist weit weg von dem, was ich beruflich mache.
 

Tommes

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
26. Okt 2009
Beiträge
9.151
Punkte für Reaktionen
1.115
Punkte
314

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Ok, die ersten Probleme beginnen, nachdem ich versucht habe mit den ersten Suchwörtern zu arbeiten. Nun Steht das im Pfad und ich bekomme es nicht mehr raus. Auch Profil löschen hilft nicht, der Text hinter dem Pfad erscheint immer wieder. Ebenso der "komische" Text im Feld für die Suchwörter.

In dieses Feld hier können doch die Wörter eingetragen werden, die im Dokument gesucht werden sollen? Brauche ich dann für die unterschiedliche Ablage in unterschiedlichen Ordnern auch nterschiedliche Profile?
In dieses Feld muss dann dieser Syntax rein, der auf der Hilfeseite zu finden ist?

1674645863032.png

1674645887790.png
1674645707110.png
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.389
Punkte für Reaktionen
1.206
Punkte
234
In dieses Feld hier können doch die Wörter eingetragen werden, die im Dokument gesucht werden sollen?
JEIN. Dieses Feld kann man nutzen, wenn man ganz einfache Tags suchen und setzen möchte. Bitte beachte die Informationen hinter dem Info-i. Möchte man die mächtigeren YAML-Regeln verwenden, muss dafür eine separate Datei genutzt werden und in dieses Feld kommt dann lediglich der Pfad dazu. Möglicherweise bringen in deinem Fall Zeilenumbrüche im Tagfeld alles durcheinander - die kann die GUI leider nicht verarbeiteten und machen in jedem Fall Probleme. Versuch mal als Erstes das Tagfeld zu leeren (am besten mit Strg+A alles markieren und dann einen Backspace machen).

Wenn sich hier die GUI weiterhin verschluckt, dann kannst du die Datenbank auch herunterladen und mir schicken. Ich versuche sie dann geradezubiegen.

Ggf. kannst du auch mal die GUI schließen und erneut öffnen. Vielleicht sind die Werte ja noch nicht 'falsch' gespeichert.
 

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Habe jetzt mal alles neu installiert.
Wie muss ich denn jetzt vorgehen, damit die Datei nach einfachen Kriterien umbenannt wird. Sie muss nicht verschoben werden, das mach ich manuell.

Als Beispiel scanne ich jetzt einen Schreiben ein in dem der Begriff "Zusatzvereinbarung" vorkommt. Dies steht im Syntax.
Code:
§yocr-§mocr-§docr_§tag_§tit
Soweit alles klar aber wo bekommt er jetzt den Tag her? Oder muss ich anders vorgehen?
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.389
Punkte für Reaktionen
1.206
Punkte
234
Wenn das Dokument nicht verschoben werden soll und auch keine Tags gesetzt werden sollen, dann reicht die Anpassung des Feldes "OCR Rename-Syntax" so, wie du es schon geschrieben hast. §tag kannst du in deinem Fall weglassen, weil du ja keine Regel definierst, die einen Tag finden könnte.
 

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Ok verstehe. Ich brauche aber Tags, da das Datum alleine nicht aussagekräftig ist. Genügt es jetzt in dem Feld "zu suchende Tags" einen festzulegen, zb. "Zusatzvereinbarung". Sollte das jetzt schon umbenannt werden, mit dem Tag im Namen "Zusatzvereinbarung"? Bei mir jedenfalls noch nciht.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.389
Punkte für Reaktionen
1.206
Punkte
234
Ja, aber OHNE ZEILENUMBRÜCHE! ;)
Auf diese Art kannst du nur Tags setzen, die so auch im Dokument vorhanden sind. Z.B. suchst du nach Allianz und Allianz wird bei einem Fund gesetzt. Verwendest du eine YAML-Regeldatei, dann kannst du auch Bedingungen erstellen oder Tags setzen, die nicht wörtlich enthalten sind (z.B. setzte Versicherung wenn Allianz gefunden).

Alle Tags, die gefunden werden, werden auch gesetzt.
Tags sind mit einem Semikolon zu trennen. Aber das steht alles hinter dem Info-i.
 

c0smo

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
08. Mai 2015
Beiträge
6.680
Punkte für Reaktionen
1.207
Punkte
254
Ok, die ersten Tests verliefen Super :)

Jetzt kommen aber schnell weitere Fragen auf. Zum Beispiel, wie würde ich am besten vorgehen, wenn ich meine ganzen Schriften jetzt einscanne und es vermeiden möchte, alles manuell umzubenennen? Nach der jetzigen Vorgehensweise müsste ich dutzende oder sogar hunderte Schlagwörter verwenden. Wie machst du/ihr das?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat