synOCR synOCR - GUI für OCRmyPDF

KleinerStiesel

Benutzer
Mitglied seit
30. Jul 2018
Beiträge
16
Punkte für Reaktionen
0
Punkte
0
...untereinander vielleicht mal unserer Tags teilen könnten...]

Finde die Idee an sich ebenso Super.

Jobcenter=Jobcenter;Bezirksamt=Bezirksamt;Howoge=Wohnung;Media Markt=MediaMarkt;MEDIA MARKT=MediaMarkt;MediaMarkt=MediaMarkt;Santander=Finanzen;BEV=Strom;
Geburtsurkunde;extraenergie=Strom;Insolvenz=Insolvenz;Spar- und Bauverein=Wohnung;ALLPOWER=Name1 Arbeit;Am Treptower Park 28-30=Name1 Arbeit;Name3;Name2;Name4;Name1;Name5;Berechnungsbogen;Techniker Krankenkasse=Krankenkasse;Kostenbescheid;norisbank=Finanzen;Yello Strom=Strom;Lohnsteuerbescheinigung=Gehalt;GEDE Gemeinsame=Wohnung;Deutsche Rentenversicherung;Consors Finanz=Finanzen;Zeugnis=Zeugnisse;Verdienstabrechnung=Gehalt;Abrechnung;Meldebescheinigung zur Sozialversicherung;Wertpapierabrechnung=Trade Republic;Kosteninformation=Trade Republic;Auftragsbestätigung=Trade Republic;TRADE REPUBLIC=Trade Republic;Vattenfall=Strom;Einkommensteuer=Steuer;AachenMünchener=Versicherung;CosmosDirekt=Versicherung;Medienversicherung=Versicherung;Lohnsteuerbescheinigung=Steuer;wehrsoldabrechnungsbeleg=Gehalt;Panzergrenadierbataillon=Gehalt;Agentur für Arbeit=Arbeitsamt;Lohn-/Gehaltsabrechnung=Gehalt;AGENTUR FÜR ARBEIT=Arbeitsamt;GrundgehaIt=Gehalt;Hermes Hausverwaltung=Wohnung;BKK Verkehrsbau=Krankenkasse;S-Bahn Berlin=VBB;Socius=Hort;Charite=Gesundheit;Jahresbescheinigung=Steuer;Finanzamt=Steuer;Hansemerkur=Versicherung;huk24=Versicherung;Genarali=Versicherung;Steuererklärung=Steuer;comdirect=Finanzen;Volkswagen Bank=Finanzen;

@geimist danke das war es^^

Gibt es eigentlich auch die Möglichkeit mit anstatt nur mit Ordnern auch mit Ordnern & Unterordnern zu Arbeiten?
sprich: Name=Test\neu
 

TeXniXo

Benutzer
Mitglied seit
07. Mai 2012
Beiträge
4.948
Punkte für Reaktionen
99
Punkte
134
Unterordner nicht möglich, hätte auch nicht viel Sinn ^^
 

HUHA

Benutzer
Mitglied seit
09. Apr 2020
Beiträge
8
Punkte für Reaktionen
6
Punkte
53
Hello.
Sorry that i write in english, but i do not know German.
Thank you for the software. I think is going to help me a lot.

Regarding this

Hallo zusammen,

auch von mir ein herzliches Dankeschön für die tolle OCR-Lösung!

Habe mir gerade eine Tagliste in Excel erstellt. Damit kann ich die Reihenfolge der Tags festlegen (z.B. zuerst die Tags mit den Absendern, dann die mit den Empfängern, dann Inhalttags).
Nach den letzten Ergänzungen hat sich der GUI beim Speichern allerdings verabschiedet, d.h. er hat nicht gespreichert und die Meldung "[Server] hat die Verbindung unerwartet geschlossen." Nach meinen Erkenntnissen ist die Grenze der Tags bei 264 erreicht.

Kann man die Anzahl irgendwie erhöhen? Bzw. ist die Grenze in synOCR oder in OCRmyPDF festgelegt?

Vielen Dank für die Rückmeldung!

and

Ich kann dir leider keine schnelle Lösung anbieten. Wir müssen mal gucken, wie wir das in Zukunft handhaben werden.
Sorry
and
Sind 4113 Zeichen inkl. Semikolons

I have the same problem. With the help of excel i compose a tag list , but is to large, about 1500 tags. If i put all of them in synOCR , then i will get a blank page when saving the list of tags.
I try to insert them in this file /usr/syno/synoman/webman/3rdparty/synOCR/etc/synOCR.sqlite but i can not.
I do not know how to insert these 1500 tags in the program.
Anyone has some ideeas ?

My next approach is to try that those 1500 tags to split them and put them in different profiles. Every profile to have maximum 4113 characters.
Is there a bad side to this ? Multiple profiles that togheter will have around 1500 tags ?
so far i had done some tests "Gesamt seit 2020-04-04 PDF/Pages: 1068/4458"
Again thank you for this software.
 
Zuletzt bearbeitet:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
The challenge lies in the interaction of the form (synOCR GUI) with Bash. You can write the tags directly into the sqlite-DB (which will probably work correctly), but as soon as you load the profile in the GUI, it contains too many characters again ...
(/volume1/@appstore/synOCR/etc/synOCR.sqlite > table "config" > field "taglist" in the desired profile row)

Your multi-profile approach won't work either, because it would require you to build a cascade of multiple operations, which may not be effective.

Sorry, I don't currently have a better answer for you.


PS: Can I ask what your main language is? I am still looking for help for multilingual support.

PPS: I'm considering an alternative option:You could simply enter the path to a text file with the tags in the tag field (optional). That way we would circumvent the problem provisionally.
 
Zuletzt bearbeitet:

Gortosch

Benutzer
Mitglied seit
04. Apr 2020
Beiträge
19
Punkte für Reaktionen
1
Punkte
3
Hallo,

erst mal vielen herzlichen Dank für deine Mühen. Finde deine Arbeit echt großartig.

Eine Frage hätte ich. Es gibt ja die Möglichkeit Dokumente nach gefundenem Datum umzubenennen. Das funktioniert auch einwandfrei. Aber gibt es auch die Möglichkeit die Dokumente nach gefundenem Jahr in Unterordner einzusortieren?


Grüße
Sven
 

HUHA

Benutzer
Mitglied seit
09. Apr 2020
Beiträge
8
Punkte für Reaktionen
6
Punkte
53
PS: Can I ask what your main language is? I am still looking for help for multilingual support.

PPS: I'm considering an alternative option:You could simply enter the path to a text file with the tags in the tag field (optional). That way we would circumvent the problem provisionally.

Hello.
Main language is Romanian, -srd -l ron
Your second ideea sounds promising. Is this active or maybe in the next update (to enter the path to a text file with tags). i think that under 1% of the users of your software , needs something like this.
Thank you again for this software.
 
Zuletzt bearbeitet:

micky1067

Benutzer
Mitglied seit
10. Nov 2016
Beiträge
49
Punkte für Reaktionen
0
Punkte
6
Hallo geimist,

ich weiß das meine Frage etwas offtopic ist. Kann man dein Script alleine nur auf einem Linux verwenden ?
Auf der Diskstation läuft das ja echt prima. Aber ich wollte das ganze auch auf einem Linux ohne Gui laufen lassen.
Welches script sollte ich dafür verwenden ? Wäre eine große Hilfe.

Viele Grüße
micky1067
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Grundsätzlich ja, wenn du die Konfiguration in der sqlite-DB manuell vornimmst.
Welches script sollte ich dafür verwenden ?
Die Dateien ./etc/synOCR.sqlite, synOCR-start.sh und synOCR.sh

Aber vielleicht ist ja FileBasedMiniDMS eher etwas für dich.
 

micky1067

Benutzer
Mitglied seit
10. Nov 2016
Beiträge
49
Punkte für Reaktionen
0
Punkte
6
Wow... so schnelle Antwort. Übrigens tolles Programm.

Danke dir. Also würde das synOCR.sh script reichen und dieses manuell anpassen ? Datenbank bräuchte man ja damit nicht, oder ?
Welche Dateien müsste man noch nehmen?
Werde mir das mal ansehen.

Noch ein schönes Osterwochenende und bleib gesund.
Grüße
micky1067
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Ja, theoretisch schon. Am Anfang des Skripts wird ja die DB ausgelesen und die Werte in den Variablen gespeichert. Dort kannst du natürlich auch alles fest hinterlegen.
 

HUHA

Benutzer
Mitglied seit
09. Apr 2020
Beiträge
8
Punkte für Reaktionen
6
Punkte
53
PPS: I'm considering an alternative option:You could simply enter the path to a text file with the tags in the tag field (optional). That way we would circumvent the problem provisionally.

Hello.
Can you help me with this ideea ?
how can i enter in file
/volume1/@appstore/synOCR/etc/synOCR.sqlite
at table " config "
for field " taglist "
a path for a file , like /volume1/@appstore/synOCR/etc/tags-list and inside this text file i should insert my tags.

I think you are the proper man to ask.

thank you.

P.S. in your next update, can you add the option in GUI for a path for text files with tags ?
 

Fischje

Benutzer
Mitglied seit
12. Apr 2011
Beiträge
37
Punkte für Reaktionen
0
Punkte
6
Hallo Stefan,

über Cashys Blog komme ich auf Umwegen also wieder hier zu Dir. Tolle Arbeit, ich werde das Ganze heute abend mal auf meiner RS1219+ ausprobieren.

Mein Plan: Erstmal PDFs mit dem Handy in den Ordner legen. Wenn das gut funktioniert, kaufe ich mir einen Scanner. Möchte das System auch ohne Smartphone (und vor allem, ohne Clientrechner der zum scannen an sein muss) nutzen. Das geht ja damit alles.

Ist die Anleitung die hier im Startpost steht alles was beachtet werden muss oder gibt es eine ausführlichere?

VG Matthias

...

  • Es besteht die Möglichkeit, über den integrierten Zeitplaner einen Zeitplan zu erstellen, oder ihr nutzt die Beschreibung (Hilfe-Seite), um einen Zeitplan über den DSM-Aufgabenplaner einzurichten. Beim integrierten Zeitplaner ist zu beachten, dass der DSM-Sicherheitsberater den zusätzlichen Croneintrag (da für DSM unbekannt) bemängeln wird.
  • auch ohne Zeitplan kann man einen manuellen Durchlauf über die Statusseite auslösen.
  • Ihr könnt für die Quelldokumente einen Suchpräfix verwenden (z.B. SCAN_). Es werden dann nur die Dokumente bearbeitet, welche einen entsprechenden Dateinamen haben. Für alle Dokumente einfach leer lassen.
  • Paketvoraussetzung: Docker
  • Sofern ihr OCRmyPDF bisher noch nicht genutzt habt, dauert der erste Programmlauf etwas länger, da das entsprechende Image zunächst geladen werden muss
  • Download von synOCR über cphub.net (falls noch nicht getan, am besten als Paketquelle eintragen, um so auch automatisch über Updates informiert zu werden).
...
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
P.S. in your next update, can you add the option in GUI for a path for text files with tags ?
That's all my idea was based on - I have to put it in first. So please wait a little longer :eek:
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
… Ist die Anleitung die hier im Startpost steht alles was beachtet werden muss oder gibt es eine ausführlichere?
Es gibt derzeit meinerseits kein gesammeltes Know-how. Eigentlich sollten die mouseover-Infos hinter jedem Formularfeld (das blaue i), sowie die Hilfeseite im Programm das meiste abdecken.

Bei Fragen darüber hinaus, bitte einfach hier melden :eek:
 

Fischje

Benutzer
Mitglied seit
12. Apr 2011
Beiträge
37
Punkte für Reaktionen
0
Punkte
6
... ich werde das Ganze heute abend mal auf meiner RS1219+ ausprobieren....

Klappt prima. Natürlich werde ich jetzt wohl erstmal Arbeit mit dem Richtigen aufbau der Tags und Kategorien haben, aber das findet sich bestimmt.


Ich starte mal mit:
Rich (BBCode):
Rechnung;Versicherung;amazon=amazon;huk24=Versicherung;Gehaltsabrechnung;R+V=Versicherung;Jahresbescheinigung;Finanzamt;Schornstein=Nebenkosten;NEW=Nebenkosten;eon=Nebenkosten;gas=Nebenkosten;

Verbesserungsvorschläge und Tipps gern gesehen ;)
 

kixxx

Benutzer
Mitglied seit
17. Apr 2020
Beiträge
1
Punkte für Reaktionen
0
Punkte
1
Hallo zusammen.

Ich habe eine synology 918+, habe mir synocr installiert und socker auch. Wenn ich aber im docker ocrmypdf starte. Dann bricht docker den start ab. Also es stoppt. Startet nicht.

Ich habe beim docker einfach die ocrmypdf image gedownloaded und gestartet.

Was habe ich falsch gemacht?
 

peterhoffmann

Benutzer
Sehr erfahren
Mitglied seit
17. Dez 2014
Beiträge
5.525
Punkte für Reaktionen
1.360
Punkte
234
@kixxx
Der Docker-Container wird nur temporär vom Script gestartet und nach Beendigung der Aufgabe wieder beendet.
 

Fischje

Benutzer
Mitglied seit
12. Apr 2011
Beiträge
37
Punkte für Reaktionen
0
Punkte
6
Also ich habe festgestellt das er paar Seiten nicht gedreht hat, wenn Sie falsch herum eingelegt wurden. Kann man das verbessern?
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat