Paperless-ngx Paperlessngx sucht Dateien im Cosume Ordner, welche bereits verarbeitet sind

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

vcdg23

Benutzer
Registriert
18. Jan. 2024
Beiträge
33
Reaktionspunkte
6
Punkte
8
Guten Tag liebe Community,


Seit gestern habe ich folgendes Problem beim Einlesen von Dokumenten in Paperlessngx:

Ich habe gestern 10 Dateien auf einmal in den Cosume Ordner getan, diese hat Paperlessngx auch sauber eingelesen und verarbeitet. Nun habe ich das Problem, dass keine neuen Dateien mehr eingelesen werden, egal wie ich sie in den Cosume Ordner packe.
Daraufhin habe ich mir das Protokoll aufgerufen und habe festegestellt, dass paperlessngx weiterhin probiert, Dateien aus dem Consume Ordner auszulesen, welches es bereits verarbeitet hat und somit natürlich der Fehler kommt file not found. Dieses wird aber ununterbrochen versucht.

Hier ein Auszug aus dem Protokoll:

Code:
[ERROR] [paperless.consumer] Cannot consume /usr/src/paperless/consume/0000274.pdf: File not found.

[ERROR] [paperless.tasks] ConsumeTaskPlugin failed: 0000274.pdf: Cannot consume /usr/src/paperless/consume/0000274.pdf: File not found.

Traceback (most recent call last):

  File "/usr/src/paperless/src/documents/tasks.py", line 149, in consume_file

    msg = plugin.run()

          ^^^^^^^^^^^^

  File "/usr/src/paperless/src/documents/consumer.py", line 521, in run

    self.pre_check_file_exists()

  File "/usr/src/paperless/src/documents/consumer.py", line 311, in pre_check_file_exists

    self._fail(

  File "/usr/src/paperless/src/documents/consumer.py", line 304, in _fail

    raise ConsumerError(f"{self.filename}: {log_message or message}") from exception

documents.consumer.ConsumerError: 0000274.pdf: Cannot consume /usr/src/paperless/consume/0000274.pdf: File not found.


Alle Dateien die ich jetzt versuche hochzuladen bleiben bei Dateiaufgaben natürlich in der Warteschlange stehen und werden nicht bearbeitet.

Es handelt sich hierbei um die MariaDB Variante, nicht PostgreSQL
 
Hast du mal probiert die Container neu zu starten? Vielleicht hängt da nur ein Prozess
 
Ja, sorry vergessen zu schreiben, alle Container neu gestartet, Stack gestoppt, neu gestartet aber es geht immer weiter.
 
Leider ohne Funktion!

Mir fällt auf, dass

/usr/src/paperless/consume/

garnicht mein consume ordner ist, sondern

/volume1/docker/paperlessngx/consume

In der docker-compose.yaml ist es richtig hinterlegt. Greift er eventuell noch auf eine andere Datei zu und wenn ja wieso hat er es geändert?
 
Poste doch mal deine compose/Stack oder wie du es halt eingerichtet hast.....
 
Bitte sehr. 1026:100 passt!

Code:
services:
  redis:
    image: redis:latest
    command:
      - /bin/sh
      - -c
      - redis-server --requirepass redispass
    container_name: PaperlessNGX-REDIS
    hostname: paper-redis
    mem_limit: 512m
    mem_reservation: 256m
    cpu_shares: 768
    security_opt:
      - no-new-privileges:true
    read_only: true
    user: 1026:100
    healthcheck:
      test: ["CMD-SHELL", "redis-cli ping || exit 1"]
    volumes:
      - /volume1/docker/paperlessngx/redis:/data:rw
    environment:
      TZ: Europe/Berlin
    restart: on-failure:5
    
  db:
    image: mariadb:11.4-noble #LTS Long Time Support Until May 29, 2029.
    container_name: PaperlessNGX-DB
    security_opt:
      - no-new-privileges:false
    hostname: paper-db
    environment:
      MYSQL_DATABASE: paperless
      MYSQL_USER: paperlessuser
      MYSQL_PASSWORD: paperlesspass
      MYSQL_ROOT_PASSWORD: rootpass
      TZ: Europe/Berlin
    volumes:
      - /volume1/docker/paperlessngx/db:/var/lib/mysql:rw
    restart: on-failure:5
    
  phpmyadmin:
    image: phpmyadmin
    hostname: paperlessngx-phpmyadmin
    healthcheck:
     test: curl -f http://localhost:80/ || exit 1
    container_name: PaperlessNGX-phpMyAdmin
    ports:
      - 2980:80
    environment:
     PMA_HOST: paper-db
     PMA_PORT: 3306
    restart: on-failure:5
    
  gotenberg:
    image: gotenberg/gotenberg:latest
    container_name: PaperlessNGX-GOTENBERG
    hostname: gotenberg
    security_opt:
      - no-new-privileges:true
    user: 1026:100
    command:
      - "gotenberg"
      - "--chromium-disable-javascript=true"
      - "--chromium-allow-list=file:///tmp/.*"
      - "--api-timeout=300s"
    restart: on-failure:5

  tika:
    image: ghcr.io/paperless-ngx/tika:latest
    container_name: PaperlessNGX-TIKA
    hostname: tika
    security_opt:
      - no-new-privileges:true
    user: 1026:100
    restart: on-failure:5

  paperless:
    image: ghcr.io/paperless-ngx/paperless-ngx:latest
    container_name: PaperlessNGX
    hostname: paperless-ngx
    mem_limit: 6g
    cpu_shares: 1024
    security_opt:
      - no-new-privileges:true
    healthcheck:
      test: ["CMD", "curl", "-fs", "-S", "--max-time", "2", "http://localhost:8000"]
      interval: 30s
      timeout: 10s
      retries: 5
    ports:
      - 8777:8000
    volumes:
      - /volume1/docker/paperlessngx/data:/usr/src/paperless/data:rw
      - /volume1/docker/paperlessngx/media:/usr/src/paperless/media:rw
      - /volume1/docker/paperlessngx/export:/usr/src/paperless/export:rw
      - /volume1/docker/paperlessngx/consume:/usr/src/paperless/consume:rw
      - /volume1/docker/paperlessngx/trash:/usr/src/paperless/trash:rw

    environment:
      PAPERLESS_REDIS: redis://:redispass@paper-redis:6379
      PAPERLESS_DBENGINE: mariadb
      PAPERLESS_DBHOST: paper-db
      PAPERLESS_DBNAME: paperless
      PAPERLESS_DBUSER: paperlessuser
      PAPERLESS_DBPASS: paperlesspass
      PAPERLESS_EMPTY_TRASH_DIR: ../trash
      PAPERLESS_FILENAME_FORMAT: '{created_year}/{correspondent}/{document_type}/{title}'
      PAPERLESS_OCR_ROTATE_PAGES_THRESHOLD: 6
      PAPERLESS_TASK_WORKERS: 1
      USERMAP_UID: 1026
      USERMAP_GID: 100
      PAPERLESS_TIME_ZONE: Europe/Berlin
      PAPERLESS_ADMIN_USER: Nutzername
      PAPERLESS_ADMIN_PASSWORD: Nutzerpassword
      PAPERLESS_URL: https://Meineadresse.de
      PAPERLESS_CSRF_TRUSTED_ORIGINS: https://Meineadresse.de
      PAPERLESS_OCR_LANGUAGE: deu+eng
      PAPERLESS_TIKA_ENABLED: 1
      PAPERLESS_TIKA_GOTENBERG_ENDPOINT: http://gotenberg:3000
      PAPERLESS_TIKA_ENDPOINT: http://tika:9998
      PAPERLESS_CONSUMER_ENABLE_BARCODES: 1
      PAPERLESS_CONSUMER_ENABLE_ASN_BARCODE: 1
      PAPERLESS_CONSUMER_INOTIFY_DELAY: 5
    restart: on-failure:5
    depends_on:
      db:
        condition: service_started
      redis:
        condition: service_healthy
      tika:
        condition: service_started
      gotenberg:
        condition: service_started
 
redis:latest kann manchmal Probleme machen. Ich hatte das mal damit versucht, lief aber nicht sauber. Ich nutze redis:7
 
Zu #5: Das hier ist die Schlüsselzeile
Code:
- /volume1/docker/paperlessngx/consume:/usr/src/paperless/consume:rw
Aus Sicht des Containers heißt das Verzeichnis /usr/src/paperless/consume, aus Sicher der DS /volume1/docker/paperlessngx/consume
 
Es sind ja bereits mehrere 100 Dateien eingelesen, problemlos! Daher würde mich das jetzt wundern.
 
Hast du dir auch mal die Logs der anderen Container angeguckt?
Und über was Webdav z.B. hast du es auch mal probiert?
 
Die anderen Container laufen ganz normal, spucken keine Error Meldungen aus.
Was meinst du mit über das Webdav probiert?
 
I have discovered the same problem. It seems that the problem is only when I upload the file to the consumer folder via SMB. Via webdav I do not have this problem, so it seems that this is due to the transfer via SMB. Could it be that Paperless wants to process the file too early, while the transfer is not yet complete?

Or maybe it creates a temporary file via SMB transfer, which is then renamed and that's why this problem arises.

Ich dachte du hast dir die Links angeguckt/durchgelesen.
 
Ja aber wie du gelesen hast:

"Nun habe ich das Problem, dass keine neuen Dateien mehr eingelesen werden, egal wie ich sie in den Cosume Ordner packe."

Er hängt in Dateien fest, die er bereits eingelesen und verarbeitet hat.
 
Sie kommen mit auf die Warteschleife.
 
Und weiter? Passiert was? Gibt es Logs?
Oder mach mal ein Backup und mach die Container neu bzw. eine zweite Instanz zum testen
 
Jo, werde ich wohl am Wochenende mal machen. Ich berichte dann!
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat