Paperless-ngx paperless erkennt einseitig bedrucktes mehrseitiges Dokument nicht

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

Stone

Benutzer
Registriert
28. Juli 2010
Beiträge
17
Reaktionspunkte
4
Punkte
3
Hi,
vielleicht kann mir hier jemand weiterhelfen, Ich habe ein Problem mit der Erkennung mehrseitiger Dokumente durch paperless ngx. Ich habe einenn MFD, der mir einen Stapel an Dokumenten in einen beliebigen Ordner scant. Diese werden als Einzelseiten im Format: Scan_#### fortlaufend gespeichert. Ich scanne zur Zeit erstmal nur einseitig bedruckte Dokumente (also ohne die Rückseite) die zwischendurch auch aus mehreren Seiten bestehen können.
Ein ganz einfaches Beispiel sieht so aus....

Dokument 1 - Seite 1 --> scan_0001
Dokument 1 - Seite 2 --> scan_0002
Dokument 2 - Seite 1 --> scan_0003
Dokument 3 - Seite 1 --> scan_0004
Dokument 4 - Seite 1 --> scan_0005
Dokument 4 - Seite 2 --> scan_0006

Wenn ich diese Dateien jetzt in einen consume-ordner kopiere, erkennt paperless nicht, das es zwischendurch auch mehrseitige Dokumente enthält und gibt mir eben für jede gesannte Seite ein Dokument. Das heisst, dass ich jetzt nachträglich den ganzen Stapel durchsuchen muss um dann diese Dateien zu einem Dokument zusammen zu führen.
Gibt es irgendwelche zusätzlichen Einstellungen die man setzen muss, damit er das erkennt?

environment:
PAPERLESS_REDIS: redis://broker:6379
PAPERLESS_DBHOST: db
USERMAP_UID: 1026
USERMAP_GID: 100
PAPERLESS_TIME_ZONE: Europe/Berlin
PAPERLESS_ADMIN_USER: xxxx
PAPERLESS_ADMIN_PASSWORD: xxxx
PAPERLESS_FILENAME_FORMAT: '{created_year}/{correspondent}/{title}'
PAPERLESS_OCR_LANGUAGE: deu+eng
PAPERLESS_OCR_USER_ARGS: '{"invalidate_digital_signatures": true}'
PAPERLESS_CONSUMER_ENABLE_BARCODES: 1
PAPERLESS_CONSUMER_ENABLE_ASN_BARCODE: 1
PAPERLESS_CONSUMER_POLLING: 5
PAPERLESS_CONSUMER_POLLING_DELAY: 30
PAPERLESS_CONSUMER_INOTIFY_DELAY: 15

Als nächster Schritt stünde dann das sannen doppelseitig bedruckter Seiten an. Full Duplex macht mein MFD leider nicht. Da muss ich dann den Stapel einmal durchlaufen lassen und danach umdrehen und ein zweites mal Scannen lassen.
 
Zuletzt bearbeitet:
Das kann Paperless nicht. Du musst das komplette Dokument in einer pdf übergeben.
 
also für jedes einzelne Dokument nur eine Datei? Oder kann ich mehrere Dokumente hintereinander weg scannen und die Datei besteht dann aus mehreren Seiten und zur automatischen Trennung benutzt man dann die ASN auf der jeweils ersten Seite eines jeden Dokuments?
 
Paperless-ngx kann nicht erkennen, ob einzelne pdf zusammengehören, die müssen als ein Dokument eingelesen werden.
 
Ich glaub ich habs verstanden .. also wie von dir erwähnt, ich muss den scanner umstellen auf eine Datei pro Dokumentenstapel-scan und entweder ich benutze dann eine trennseite oder die ASN Codes, damit PPL die Trennung der einzelnen Dokumente vornehmen kann.
Danke
 
Ja, so herum funktionierts, mehrere Dokumente in einer Datei geht, und dann per Trennseite gemäß Anleitung in mehrere aufteilen. Mittlerweile könntest du das ohne Trennseiten auch manuell im Nachgang erledigen, das empfehle ich aber nicht.
 
Eine kleine Alternative wäre die komplette Datei mit Foxit-PDF zu öffnen und die asncodes per copy paste auf die jeweilige erste Seite eines dokuments anzubringen
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat