ecoDMS erfahrungsaustausch?

Chr!s

Benutzer
Mitglied seit
22. Dez 2021
Beiträge
46
Punkte für Reaktionen
25
Punkte
68
Interessant, ich hatte ich hatte die gleiche Idee fürs OCR synOCR zu testen bin aber aus zeitgründen noch nicht dazu gekommen. Zu deinem Problem mit dem scaninput Ordner…
In ecodms gibt es in den Einstellungen die Möglichkeit ein häkchen zusätzen ob die Texterkennung erneut durchgeführt werden soll wenn der Scan bereits Text enthält. Hab den genauen Wortlaut leider nicht in Kopf. Glaube auch es ist standardmäßig so eingestellt das keine erneute Texterkennung durchgeführt wird. Hoffe das hilft dir weiter bin bis jetzt eher noch in der Experimentier- und Einlernphase was ecodms betriff.
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.605
Punkte für Reaktionen
1.036
Punkte
194
Super, dank Deines Hinweises habe ich es gefunden: in den ecoDMS Einstellungen unter OCR-Optionen gibt es "Vorhandene OCR von Dokumenten verwerfen und neu erstellen". Da ist bei mir ein Haken drin gewesen, den habe ich jetzt herausgenommen. Bin bei ecoDMS auch neu.
 
  • Like
Reaktionen: AllinOne und oschmidt

Chr!s

Benutzer
Mitglied seit
22. Dez 2021
Beiträge
46
Punkte für Reaktionen
25
Punkte
68
Naja ich habe nir von synOCR keine große Verbesserung versprochen da meines Wissens nach beide Tesseract als OCR Engine verwenden daher fand ich deine Aussage sehr interessant. Ich hatte mit das übrigens so vorgestellt dass der scanoutput von synocr der scaninput von ecodms ist. Würde mich freuen wenn du ein kurzes feedback geben könntest wie du das letztendlich umgesetzt hast und wie die Ergebnisse sind.
 
  • Like
Reaktionen: AllinOne

oschmidt

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
92
Punkte für Reaktionen
31
Punkte
68
Du wirst alles, was du von eco verarbeitet haben willst, in den Scaninput Ordner legen müssen.
Ich glaube kaum das du tiffsplit direkt ansteuern kannst.
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.605
Punkte für Reaktionen
1.036
Punkte
194
Also ich habe ein Dokument, daß ich mehrfach durch ecoDMS habe ocr'en lassen, da kam jedesmal "Sanitä" beim OCR heraus. Mit synOCR hatte ich endlich das gewünschte Ergebnis "Sanitär". Und es war kein unklarer Scan.
Ich lege jetzt den OCR-Output von synOCR im scaninput-Ordner ab und lasse bei den PDF/A mit durchgeführtem OCR keinen weiteren OCR mehr laufen - gemäss der jetzt geänderten Einstellungen.
D.h. workflow ist jetzt: Scanner per FTP in den synOCR-Eingangsordner - synOCR nach ecoDMS scaninput, kein weiteres OCR bei vorhandenem OCR.
 
  • Like
Reaktionen: AllinOne

Chr!s

Benutzer
Mitglied seit
22. Dez 2021
Beiträge
46
Punkte für Reaktionen
25
Punkte
68
super, jetzt hast du mich dazu gebracht mir das Thema synOCR auch nochmal anzugehen :) allerdings scheint es für DSM 7 noch kein synOCR zu geben bzw. habe es noch nicht auf anhieb gefunden. Hast du noch noch dsm6?
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.605
Punkte für Reaktionen
1.036
Punkte
194
Ja, ich habe noch DSM6 auf meinen Geräten, da bleiben die auch mindestens bis Juni 2023.
 

Stationary

Benutzer
Sehr erfahren
Mitglied seit
13. Feb 2017
Beiträge
3.605
Punkte für Reaktionen
1.036
Punkte
194

Chr!s

Benutzer
Mitglied seit
22. Dez 2021
Beiträge
46
Punkte für Reaktionen
25
Punkte
68
Mir scheint, daß Stephan hier eine Version für DSM 7 anbietet: https://geimist.eu/synOCR/synOCR_DSM7_latest.html Könnte aber eine beta sein, habe ich natürlich nicht ausprobiert.
Habe nun synOCR unter DSM7 am laufen. Nach erstem Test scheint die Texterkennung tatsächlich etwas Besser zu sein als die von ecodms selber allerdings habe ich nur eine Dokument zum Testen verwendet. Hier Hatte ich das Problem dass bei einer Abrechnung das Datum rechts oben im Dokument steht, dieses wurde einfach nicht als Text erkannt, nach der Verarbeitung durch SynOCR wird das Datum erkannt.

Wenn ich es richtig gesehen habe erzeugt synOCR während der Verarbeitung PDF Dateien mit dem Namen "TEMP..." im Output-Ordner. Wenn dieser Output-Ordner nun gleichzeitig der ecoDMS Input-Ordner ist könnte ich mir vorstellen dass es möglicherweise zu Problemen kommen kann... wobei mir mit der ersten Test-PDF diesbezüglich kein Fehler aufgefallen. Ist Ich werde weiter testen...
 

SebastianHue

Benutzer
Mitglied seit
23. Jan 2021
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hallo auch ich beschäftige mich seit ein paar Tagen mit dem EcoDMS.
Ich möchte als ersten Schritt gerne unsere eingehenden Lieferscheine kategorisieren.
Dabei habe ich jetzt in der Testumgebung einige Lieferscheine mehrfach in das EcoDMS eingelesen, gibt es eine Möglichkeit dass das System selbstständig erkennt, dass ein Dokument schon in der Datenbank vorhanden ist? Vielleicht anhand der Klassifizierung in diesem Beispiel Lieferant und Lieferschein Nr.?
Ich habe dazu bisher leider nichts gefunden.
 

oschmidt

Benutzer
Mitglied seit
17. Sep 2020
Beiträge
92
Punkte für Reaktionen
31
Punkte
68
Du möchtest verhindern das Duplikate eingelesen werden? Ich glaube so eine Funktion gibt es nicht.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.388
Punkte für Reaktionen
1.206
Punkte
234
Mir scheint, daß Stephan hier eine Version für DSM 7 anbietet: https://geimist.eu/synOCR/synOCR_DSM7_latest.html Könnte aber eine beta sein, habe ich natürlich nicht ausprobiert.
Der Link ist korrekt. Und nein, das ist keine Beta, sondern wäre die Version, welche eigentlich auf cphub.net zu finden sein sollte.
Ich hoffe, @Matthieu hat uns da nicht vergessen … :cry:

Wenn ich es richtig gesehen habe erzeugt synOCR während der Verarbeitung PDF Dateien mit dem Namen "TEMP..." im Output-Ordner.
Das ist korrekt. Das Tempfile ist die Ausgabe von OCRmyPDF. Anschließend werden die Rechte wiederhergestellt und die Verschlagwortung / Sortierung gestartet (die ja in diesem Fall hier nicht zur Anwendung kommt).
 
Zuletzt bearbeitet:
  • Like
Reaktionen: AllinOne

servilianus

Benutzer
Mitglied seit
26. Dez 2017
Beiträge
898
Punkte für Reaktionen
243
Punkte
63
Ja das wäre ein Ziel. Doppelte Dokumente führen doch im Allgemeinen im wieder zu Problemen oder wie wird das von euch gehandhabt?
Eine Funktion, die erkennt, das Dokumente doppelt eingelesen worden sind, kann es nur in der InBox geben, also bevor das Dokument archiviert worden ist. Denn: Sobald ein Dokument einmal archiviert worden ist, kann und soll es nicht mehr verändert und gelöscht werden (sondern nur noch in den Papierkorb verschoben werden), bzw. es kann es aus dem Papierkorb erst dann gelöscht werden, wenn die hinterlegte Löschfrist (beispielsweise für Rechnungen zehn Jahre) für archivierte Dokumente überschritten worden ist.

Der Grund ist, dass ecoDMS mit den Grundsätzen für die ordnungsgemäßen Buchführung in Deutschland (GoBD) arbeitet - und die besagt, dass jedes in einen Betrieb einlaufende (und ausgehende) Dokument (Rechnungen, Geschäftsbriefe) einen Geschäftsvorfall darstellt, und unverändert sogleich archiviert werden muss, und dann den geltenden gesetzlichen Archivierungsvorschriften unterliegt. Einmal archiviert darf sich das Ursprungsdokument nicht mehr verändern lassen (sondern nur neue, rückverfolgbare Versionen des Ursprungsdokument sich erstellen lassen, beispielsweise durch Annotationen auf der pdf in ecoDMS).

Kurzum: Wenn man versehentlich dasselbe Dokument doppelt archiviert, muss man es manuell in den Papierkorb verschieben, am besten auch mit einer Annotation, warum sich das Dokument im Papierkorb befindet (also wenn man ecoDMS geschäftlich nutzt, wofür es ja vorgesehen ist). Falls nämlich ein Finanzbeamter bei einer Buchführung verlangt, Zugriff auf ecoDMS zu erhalten.

Oder man lässt vom Scanner grundsätzlich nicht direkt automatisch ins Archiv scannen, sondern nur in die Inbox - und muss dann dort manuell schauen, ob das Dokument evtl. mehrfach gescannt worden ist, bevor man es manuell archiviert.

Aber bei mir kommt doppeltes Scannen /Archivieren eigentlich so gut wie nie vor: Ich stempele jedes Dokument vorher mit einem Stempel a la: "Gescannt", jage das Dokument durch den Scanner, hefte das Dokument ab. Anhand des Stempels kann ich später erkennen, dass das Dokument schonmal gescannt worden war.

Und falls doch, kann ich im Archiv im betreffenden Ordner eigentlich recht schnell sehen, dass dort zwei oder mehrere Dokumente erscheinen, die dort mit identischen Rechnungsnummer, Betrag, Rechnungsdatum etc. kategorisiert worden sind und eines davon dann mit einer entsprechenden Annotation ("Doppel-Archivierung) in den Papierkorb verschieben.
 
Zuletzt bearbeitet:
  • Like
Reaktionen: AllinOne

Ondaroxx

Benutzer
Mitglied seit
01. Mrz 2021
Beiträge
15
Punkte für Reaktionen
2
Punkte
3
Hi, ich habe hier leider keine Antwort auf mein Problem mit ecoDMS gefunden, deswegen erläutere ich es kurz hier und hoffe auf Antwort :)

Ich habe ecoDMS erfolgreich seit Monaten laufen und auch noch vor kurzem Dokumente über meinen Scanner gescannt. Auf einmal zeigt er mir neue Scans allerdings nicht mehr in der Inbox ein. Der Drucker scant sie korrekt in das Scaninput Verzeichnis ein, ich kann sie dort sehen. Es erfolgt aber ohne Änderung keine Verarbeitung der Scans.

Hab alles auch bereits neu gestartet und geupdatet, aktuell weiß ich nicht weiter. Wenn ich sie manuell importieren werden die PDFs korrekt archiviert. Nur der Weg über den Scaninput klemmt.
 

servilianus

Benutzer
Mitglied seit
26. Dez 2017
Beiträge
898
Punkte für Reaktionen
243
Punkte
63
- verschwinden die pdfs denn aus dem ScanInput-Ordner = werden sie verarbeitet?

- falls ja: kann es sein, dass die pfs deswegen nicht (mehr) in der Inbox auftauchen, weil sie automatisch im Archiv abgelegt worden sind?
 
  • Like
Reaktionen: AllinOne

Ondaroxx

Benutzer
Mitglied seit
01. Mrz 2021
Beiträge
15
Punkte für Reaktionen
2
Punkte
3
Nein, sie bleiben da einfach unverarbeitet liegen. Da ist irgendwo der Break. Im Docker ist das Verzeichnis aber korrekt hinterlegt. Wie gesagt, ich hatte ja auch nichts geändert und bis vor kurzen problemlos damit gearbeitet.
 

servilianus

Benutzer
Mitglied seit
26. Dez 2017
Beiträge
898
Punkte für Reaktionen
243
Punkte
63
Versuch doch mal, eine andere pdf, die nicht vom Scanner kommt, in den Ordner zu ziehen. Um zu sehen, ob evtl. die Scanner-pdfs bzw. Scanner-Einstellungen daran schuld sind, dass sie nicht verarbeitet werden.
 
  • Like
Reaktionen: AllinOne


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat