synOCR synOCR - GUI für OCRmyPDF

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.401
Punkte für Reaktionen
1.213
Punkte
234
  1. Frage: Brauchst du zwei Profile?
  2. Müssen die Quellordner identisch sein?
    • Hier könntest du mit unterschiedlichen Präfixen arbeiten, um nur bestimmte Dokumente mit einem Profil zu verarbeiten.
So kann man ggf. auch im Scanner entsprechende Profile anlegen, die z.b. den Dateinamen zwischen geschäftlich_xxx.pdf und privat_xxx.pdf unterscheiden.
 
  • Like
Reaktionen: Jesse69

Jesse69

Benutzer
Mitglied seit
22. Aug 2008
Beiträge
55
Punkte für Reaktionen
3
Punkte
8
OHA! Ich hab jetzt zum default-Profil gewechselt - die Dateien im "In"Verzweichnis alle gelöscht, neu generieren - Karstens Excel exportieren lassen und zack gehts

Das Zweitprofil kam aus der Situation, dass es nicht funkionierte - machste Neu und wird dann schon.
Karsten hatte in seinen Videos erwähnt, dass er mehrere Profile zur Anwendung bringt. (okay, im Detail hatte ich mich damit noch überhaupt nicht beschäftigt)
 
  • Like
Reaktionen: Struppix und geimist

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
584
Punkte für Reaktionen
33
Punkte
54
Das bedeutet ich kann mehrere Profile gleichzeitig haben die auch nacheinander abgearbeitet werden, inkl. je einer möglichen YAML-Datei?
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
857
Punkte für Reaktionen
160
Punkte
63
OHA! Ich hab jetzt zum default-Profil gewechselt - die Dateien im "In"Verzweichnis alle gelöscht, neu generieren - Karstens Excel exportieren lassen und zack gehts

Das Zweitprofil kam aus der Situation, dass es nicht funkionierte - machste Neu und wird dann schon.
Karsten hatte in seinen Videos erwähnt, dass er mehrere Profile zur Anwendung bringt. (okay, im Detail hatte ich mich damit noch überhaupt nicht beschäftigt)
Ich erstelle / überarbeite gerade die Videos neu. Die werden kürzer und kompakter und es wird mehrere Parts geben. Dann auch mit Kapiteln / Sprungmarken für die einzelnen Themen.
 
  • Like
Reaktionen: Jesse69

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
857
Punkte für Reaktionen
160
Punkte
63
Das bedeutet ich kann mehrere Profile gleichzeitig haben die auch nacheinander abgearbeitet werden, inkl. je einer möglichen YAML-Datei?
Ja korrekt. Aber idealerweise mit jeweils einem "Input" Ordner.
 
  • Like
Reaktionen: Yippie

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
584
Punkte für Reaktionen
33
Punkte
54
Thanks!
Nutze bisher nur ein Profil, dafür aber mit einer ellenlangen YAML-Datei und ja, leuchtet ein, dass dafür verschiedene Eingangs-Ordner notwendig sind.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.401
Punkte für Reaktionen
1.213
Punkte
234
… leuchtet ein, dass dafür verschiedene Eingangs-Ordner notwendig sind.
Wie gesagt: nicht zwingend.

Dazu mal die Quickinfo für Suchmuster Quelldateiname:
Nur PDFs mit definiertem Präfix bearbeiten (z.B. "SCAN_")
leerlassen, wenn alle Dokumente verarbeitet werden sollen
! am Anfang invertiert die Suche ( !value )
$ am Ende definiert den Begriff als Suffix ( value$ )
 

Struppix

Benutzer
Mitglied seit
10. Apr 2009
Beiträge
857
Punkte für Reaktionen
160
Punkte
63
Wie gesagt: nicht zwingend.

Dazu mal die Quickinfo für Suchmuster Quelldateiname:
Es bleibt sich unterm Strich doch gleich, ob ich im Scanner bspw. per Preset mit verschiedenen Präfix oder verschiedenen Verzeichnissen hantiere.
Aber schön, dass es beide Varianten gibt, gerade wenn man die pdf zB. per Script vorsortiert oder umbenennt, oder der Scanner nur eine Variante von beidem beherrscht.

Karsten
 

deathlord

Benutzer
Mitglied seit
12. Apr 2012
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Danke. Wenn überhaupt, wird es mit einer Umsetzung aber nicht heute oder morgen. Spontan würde ich dann auch ein strukturiertes Format mit einem Key:Value Paar(e) bevorzugen, damit User auch andere Ideen damit umsetzen können. Aber wie gesagt: ich kann nichts versprechen. Es gibt ja auch noch andere Wünsche :giggle:

Erstmal vielen Dank für das geniale Programm. Kann es sein, dass Dein Server / Download-Link aktuell offline ist?
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
14.532
Punkte für Reaktionen
5.095
Punkte
544
Ist mir auch schon aufgefallen, dass der hin und wieder nicht erreichbar ist. Einfach in ein paar Minuten nochmals versuchen
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.401
Punkte für Reaktionen
1.213
Punkte
234
Kann es sein, dass Dein Server / Download-Link aktuell offline ist?
Selfhost hat gerade ein technisches Problem, sodass das Routing zu meiner Domain nicht passt. Sie sind wohl dran …

@plang.pl Bis auf die Zwangstrennung habe ich eigentlich eine hohe Uptime. Kannst mir gerne mal eine PN schreiben, wenn dir es mal wieder auffällt.
 

plang.pl

Benutzer
Contributor
Sehr erfahren
Maintainer
Mitglied seit
28. Okt 2020
Beiträge
14.532
Punkte für Reaktionen
5.095
Punkte
544
Alles klar, mache ich. So oft lade ich mir synOCR aber nicht runter :D
 
  • Haha
Reaktionen: Monacum und Tommes

Thonav

Benutzer
Sehr erfahren
Mitglied seit
16. Feb 2014
Beiträge
7.879
Punkte für Reaktionen
1.503
Punkte
274
Nö - komme nicht auf Deine geimist.eu Seite...
 

!&all

Benutzer
Mitglied seit
03. Sep 2010
Beiträge
14
Punkte für Reaktionen
4
Punkte
3
Hey,

Ich habe leider folgendes Problem: Ich habe bei einigen gescannten und mit OCR versehen Dateien im Nachgang per Vorschau auf dem Mac leere Seiten gelöscht. Dadurch ist leider auch der OCR Layer "zerstört" worden und die Dateien sind nicht mehr durchsuchbar (schein ein bekannten Problem mit Vorschau zu sein). Nun wäre die Frage, inwieweit ich den OCR Layer wieder entfernen kann und neu hinzufügen kann. Kann ich das irgendwie mit synOCR oder den unterliegenden Technologien automatisieren?

Besten Dank vorab!
 
  • Like
Reaktionen: Tommes

Yippie

Benutzer
Mitglied seit
01. Feb 2011
Beiträge
584
Punkte für Reaktionen
33
Punkte
54
Warum löscht du die leeren Seiten nicht vorab?
 

!&all

Benutzer
Mitglied seit
03. Sep 2010
Beiträge
14
Punkte für Reaktionen
4
Punkte
3
Ja, ab jetzt mache ich das so aber das hilft leider nicht bei den Hunderten bereits gescannten Dokumenten 😉
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat 

 
 
  AdBlocker gefunden!

Du bist nicht hier, um Support für Adblocker zu erhalten. Dein Adblocker funktioniert bereits ;-)

Klar machen Adblocker einen guten Job, aber sie blockieren auch nützliche Funktionen.

Das Forum wird mit hohem technischen, zeitlichen und finanziellen Aufwand kostenfrei zur Verfügung gestellt. Wir zeigen keine offensive Werbung und bemühen uns um eine dezente Integration.

Bitte unterstütze dieses Forum, in dem du deinen Adblocker für diese Seite deaktivierst.

Du kannst uns auch über unseren Kaffeautomat einen Kaffe ausgeben oder ein PUR Abo abschließen und das Forum so werbefrei nutzen.

Vielen Dank für Deine Unterstützung!