synOCR synOCR - GUI für OCRmyPDF

hamitaga

Benutzer
Mitglied seit
16. Jul 2021
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Ne, normal war es natürlich nicht. Vor allem, da ich nichts verändert hatte.
Entweder greife ich direkt über LAN auf die DSM zu oder VPN.
Ich habe deine Version installiert, aber das Problem bleibt das selbe.
Im Paketzentrum wird das richtige Icon angezeigt. Beim Öffnen und der Programmübersicht jedoch nicht.
 

hamitaga

Benutzer
Mitglied seit
16. Jul 2021
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Ich habe das „Problem“ teilweise lösen können.
Wenn ich mich am iPad anmelde, kann ich SynOCR ganz normal öffnen.
Keine Ahnung, was da am iPhone für Probleme bestehen.
Ach, nutze die 220+
 

hamitaga

Benutzer
Mitglied seit
16. Jul 2021
Beiträge
43
Punkte für Reaktionen
5
Punkte
8
Auch das löst das Problem am iPhone nicht. Aber wichtig ist mir, dass es grundsätzlich wieder funktioniert. Ist schon ne ordentliche Arbeitserleichterung. Vielen Dank dafür!
 
  • Like
Reaktionen: geimist

andipc

Benutzer
Mitglied seit
15. Jun 2014
Beiträge
30
Punkte für Reaktionen
0
Punkte
6
Hallo,
habe mir erst vor 2 Tagen synOCR angetan. Bis jetzt manuelles OCR mit Abbyy Transformer.
Der Automatismus an synOCR hat mich interessiert und gefällt mir sehr gut.
Die ersten Tests sehen gut aus. Jetzt wollte ich sehen was synOCR so leisten kann auf meiner alten Hardware.
Habe mit einem alten MFC8370 ein in Word geschriebenes Dokument gescannt.
Den einzigen Parameter den ich in synOCR verändert habe: -srd -l deu zu -frd -l deu (damit er einen reocr durchführt falls schon was im Textlayer steht (mit dem geänderten Parameter ein durchlaufen lassen - hier habe ich noch keinen Vergleich zu der Originaleinstellung)
4 mal den gleichen Text in alle Himmelsrichtungen geschrieben, um zu sehen wie sich das Teil schlägt.
Im Gegenzug habe ich die PDF ebenfalls mir rescan durch Abbyy Transformer gejagt (die Datei wird mal 4x so groß).
Mich würde interessieren wie sich die Originaldatei bei euch schlägt (SynOCR_Testscan)
Als Vergleich habe ich mal das Resultat von Abbyy Transformer noch dazu gehängt (SynOCR_Testcan-Abbyy-reOCR).
Auf einer älteren 412+ mit aktueller 6.x

Es wäre mal interessant was bei euch synOCR aus der Datei SynOCR_Testscan.pdf an Leserlichem so rausbekommt.
synOCR: 2 Treffer (egal welches Wort) horizontal und von rechts lesend.
Abbyy: 3 Treffer, hier kommt noch von links lesend dazu.
Keiner schaffte Überkopf und 45° gedreht.

Hoffe ich bin nicht komplett OT.

Gruß Andreas
 

Anhänge

  • SynOCR_Testscan-Abbyy-reOCR.pdf
    805,3 KB · Aufrufe: 6
  • SynOCR_Testscan.pdf
    185,6 KB · Aufrufe: 5

cm_

Benutzer
Mitglied seit
08. Aug 2021
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

ich bin vor ein paar Tagen auf synOCR gestoßen - habe es heute ausprobiert und bin begeistert. Respekt und vielen Dank dafür!
Ich habe jetzt schon eine komplette Strecke vom Scanner auf NAS mit automatischer Verarbeitung durch synOCR etabliert. :)

Zum renaming bzw. zu den Tags habe ich noch Fragen:
- Gibt es eine Doku bzgl. der Regeln und wie die externe Datei aussehen muss?
- Wenn mehrere Tags zutreffen, werden ja hard links gesetzt. Daraus ergeben sich m.E. zwei Nachteile gegenüber Verknüpfungen. a) Im Explorer sieht es so aus als belegt jedes Dokument auch den vollen Speicher und b) finde ich die Dokumente in der Suche dann auch immer mehrfach.
Wie geht ihr damit um? Oder gibt es die Möglichkeit statt hard links Verknüpfungen erstellen zu lassen?

Viele Grüße
Christian
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.385
Punkte für Reaktionen
1.199
Punkte
234
Herzlich willkommen hier im Forum, Christian :)

- Gibt es eine Doku bzgl. der Regeln und wie die externe Datei aussehen muss?
Wenn du dir über den Button in der GUI die Regeldatei erstellen lässt, wird eigentlich schon alles darin erklärt (am besten vorher ein paar Beispieltags in der GUI eintragen - die werden mit konvertiert).

Detailfragen kannst du gern hier stellen.

Daraus ergeben sich m.E. zwei Nachteile gegenüber Verknüpfungen
Bei Softlinks (Verknüpfungen wie du sie nennst) überwiegen aus meiner Sicht die Nachteile:
  • sie lassen sich nicht über die Dateifreigabe & Filestation wie Dateien behandeln (meine ich …)
  • du darfst nicht versehentlich das Original löschen

Wie relevant ist der Speicherplatzmehrverbrauch in der Praxis?:
  • für eine Datei müssen gleichzeitig mehrere Kategorien, bzw. Zielordner greifen, die auch noch auf unterschiedlichen Volumes liegen
  • um welche Größenordnungen geht es bei PDFs?
Ich sehe hier keine praxistaugliche Alternative, lass mich aber auch gern eines Besseren belehren.
 

cm_

Benutzer
Mitglied seit
08. Aug 2021
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hallo Stephan,

vielen Dank für die schnelle Antwort.
Den Button hatte ich übersehen :LOL: das beantwortet für den Moment alles.

Ok, dann versuche ich auch nochmal meine Tags so zu schneiden, dass es möglichst wenig Überschneidungen gibt.

Viele Grüße
Christian
 

synDS918

Benutzer
Mitglied seit
08. Aug 2021
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Guten Morgen,

begeisteter synOCR Nutzer, der nun seine DS918+ auf DSM V7.0 (von DSM V6) geupdatet hat.
Leider hat dies synOCR nicht so gut vertragen.
Deshalb musste das Paket synOCR über das Paketzentrum deinstallieren und (nach Neustart) erneut manuell über cphub.net ( Version 1.1.902 ) installieren (jbarlow83/ocrmypdf: latest wird verwendet)
Hiernach habe ich - wie unter Hilfe -> Schnellstart beschrieben - erneut eine neue Aufgabe für /usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh im Aufgabenplaner erstellt.
Sicherheitshalber habe ich die Synology danach komplett neugestartet und einige Probe-PDF Dateien am entsprechenden Ort zum OCRen mit SynOCR abgelegt.
Die automatische Verarbeitung von Originaldateien zu OCR-verarbeiteten Dateien funktioniert tadellos.

Leider bekomme ich aber die folgende Meldung unter > Übersicht < nicht weg (siehe Screenshot)
Ist das nur ein Anzeigefehler?

Danke!
Gruß
 

Anhänge

  • 2021-08-09 09_03_16-Synology DS918+.png
    2021-08-09 09_03_16-Synology DS918+.png
    39 KB · Aufrufe: 14
  • synOCR_2021-08-08_12-50-01.log.txt
    10,1 KB · Aufrufe: 6

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.385
Punkte für Reaktionen
1.199
Punkte
234

cm_

Benutzer
Mitglied seit
08. Aug 2021
Beiträge
3
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen,

ich habe heute Nacht einen "Massenlauf" über meine ca. 600 Dokumente gemacht (mit Option force) - hat im Großen und Ganzen gut funktioniert.

Zwei Dinge sind mir aufgefallen:
1. Ich bekomme diverse Ordner a la "Auto_ADMIN_Aug-09-024419-2021_Conflict" erstellt - in jedem liegt ein File. "Auto" ist eine meiner Kategorien - ich weiß nicht, ob das hier gemeint ist. Der Unterordner "auto" (klein geschrieben) wurde aber erstellt. Mir ist nicht klar, wo der conflict ist - aus dem log konnte ich nichts auffälliges herauslesen.

2. Einige (wenige) Files bleiben im Input-Ordner, obowhl sie verarbeitet und im Output abgelegt werden... auch hier sehe ich im log nichts auffälliges.

Könnt ihr mir bzgl. Ursachen weiterhelfen?

Viele Grüße
Christian
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.385
Punkte für Reaktionen
1.199
Punkte
234
Ich bekomme diverse Ordner a la "Auto_ADMIN_Aug-09-024419-2021_Conflict" erstellt
Das klingt für mich nach einem Sync-Konflikt mit Drive. Der Fehler stammt nicht unmittelbar von synOCR.

Einige (wenige) Files bleiben im Input-Ordner, obowhl sie verarbeitet und im Output abgelegt werden
Ohne Log kann auch ich nichts dazu sagen. Was steht im Log, wenn du synOCR noch einmal startest?
 

Tom1000

Benutzer
Mitglied seit
01. Jul 2021
Beiträge
21
Punkte für Reaktionen
3
Punkte
3
Was noch 'ne schicke Funktion wäre, ist, wenn mehrere Dateien, die zu einem Scan gehören, von SynOCR zusammengefasst werden können.
Selbstverständlich müsste man die betreffenden Dateien manuell markieren und die Reihenfolge festlegen. Das automatisch zu machen wäre etwas zuviel verlangt...

Beispiel: Mein Scanner im Drucker (Brother 3770) macht bei ca. 30 Seiten Schluss, dann ist der (nicht erweiterbare) Speicher voll. Also scanne ich in Häppchen und schustere das mit dem Adobe Acrobat (gaaanz alte Version) zusammen.

Wäre superklasse, wenn das über SynOCR ginge. Aber ich befürchte, da hat Stefan keine Zeit zu. (Ist ja auch ein "first world problem...)

Wäre nur "nice to have"... ;)
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.385
Punkte für Reaktionen
1.199
Punkte
234
Das steht schon auf der Liste (so rein theoretisch … :rolleyes:).

Wahrscheinlich ließe sich das mit den in OCRmyPDF integrierten Tools relativ leicht realisieren. Die automatische Umsetzung in der Praxis finde ich dann schon schwieriger:
  • Sollen immer alle Dokumente im Eingangsordner zusammengefasst werden?
  • Soll man sich generell über einen Schalter in der GUI für eine Variante entscheiden müssen?
  • Soll das nur bei einer bestimmten Benennung greifen?
 

Tom1000

Benutzer
Mitglied seit
01. Jul 2021
Beiträge
21
Punkte für Reaktionen
3
Punkte
3
Hi Christian,

es könnte daran liegen, dass die Files geschützt sind.

Das Problem hatte ich auch und Stefan hat mich drauf aufmerksam gemacht. Das kann man aber im Acrobat Reader unter Einstellungen oder Eigenschaften sehen...

LG Thomas
2. Einige (wenige) Files bleiben im Input-Ordner, obowhl sie verarbeitet und im Output abgelegt werden... auch hier sehe ich im log nichts auffälliges.

Könnt ihr mir bzgl. Ursachen weiterhelfen?

Viele Grüße
Christian
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.385
Punkte für Reaktionen
1.199
Punkte
234

Tom1000

Benutzer
Mitglied seit
01. Jul 2021
Beiträge
21
Punkte für Reaktionen
3
Punkte
3
Oh, das hatte ich überlesen... Dann sollte das tatsächlich nicht der Grund sein.
 

FoxageX

Benutzer
Mitglied seit
09. Jul 2021
Beiträge
20
Punkte für Reaktionen
2
Punkte
3
Hallo zusammen,

mein Anliegen betrifft die Darstellung des Datums.

Aktuell wird das Datumsformat wie folgt ausgegeben: JJJJ-MM-TT. Gibt es eine Möglichkeit die Darstellung auf die persönlichen Bedürfnisse anzupassen? Wie kann z. B. das Format JJMMTT oder JJJJMMTT ausgegeben werden?

Freue mich über Ideen.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.385
Punkte für Reaktionen
1.199
Punkte
234
Das änderst du mit der Renamesyntax in der GUI. Standard ist §yocr-§mocr-§docr_§tag_§tit Du müsstest halt einfach die Bindestriche weglassen. Allerdings arbeitet synOCR derzeit nur mit einem vierstelligen Jahr.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat