Paperless DB retaggen

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

XXL1602

Benutzer
Registriert
18. Juni 2024
Beiträge
90
Reaktionspunkte
5
Punkte
8
Hi all,

Habe vor Ewigkeiten Paperless eingerichtet bekommen, da diesbezüglich digitaler Neandertaler. (Windows 11, Portainer) eingerichtet hatte:

Würde es nun gerne etwas restaurieren, da ich mich sozusagen "ver-tagged" habe (nachdem ich nun ein Video gesehen habe, wie schön man das alles automatisch machen kann.

Dieses Vid setzt 1.) Linux voraus, 2.) überfordert es mich. Natürlich habe ich sämtliche Tags und Sichten erstmal gelöscht.

Was muss ich tun, um zu der automatischen Zuweisung der Tags zu gelangen?

VG
 
Vielleicht könntest du hier teilen, welches Video du gesehen hast, dann können wir damit helfen...
 
Wusste nicht, ob man das so darf....wird einem ja oftmals heutzutage nen Strick aus allem gedreht:
Es ist dieses Video: https://www.youtube.com/watch?v=8J9qVlgFyEc&t=948s

Hatte dann noch die glorreiche Idee, es mit Chatgpt zu versuchen, liefert - nach langem Kampf-:

So startest du den Retagger​

1️⃣ Portainer → Container​

Gehe auf:
webserver1
2️⃣ Console öffnen
Oben:
Console

Einstellungen:
User: root
Connect

Jetzt bist du drin und siehst sowas:
@paperless/usr/src/paperless

3️⃣ Jetzt kommt der entscheidende Befehl​

Nicht vertippen:
manage.py document_retagger<br></span></span>
Enter.


Was du sehen MUSST​

Jetzt laufen Zeilen durch:
Re</span></span><span>-evaluating </span><span><span>document</span></span><span> </span><span><span>1</span></span><span><br></span><span><span>Re</span></span><span>-evaluating </span><span><span>document</span></span><span> </span><span><span>2</span></span><span><br></span><span><span>Re</span></span><span>-evaluating </span><span><span>document</span></span><span> </span><span><span>3</span></span><span><br></span></span>
Das ist genau der YT-„Retagger“.

Er macht:

  • Regeln anwenden
  • Tags setzen
  • Korrespondenten erkennen
  • alte Dokumente neu klassifizieren
Jetzt wird dein „Finanzamt“-Tag plötzlich auf alte Dokumente springen.


Falls stattdessen kommt:​



command not found
Dann:
<span><span><span>cd</span></span><span> /usr/src/paperless/src<br>python3 manage.py document_retagger<br></span></span>

Danach unbedingt​

Browser → Paperless → F5
(der Browser cached brutal viel)

Dann oben in die Suche:

finanzamt
oder links im Tag.


Wenn danach trotzdem nichts markiert ist​

Dann ist zu 95% kein OCR-Text vorhanden.
Und das ist DER klassische Anfänger-Fehler bei Paperless:
PDF sieht normal aus → enthält aber nur ein Bild → Paperless kann keine Wörter finden → Regeln wirken nicht.

Das prüfen wir dann in 10 Sekunden.
Sag mir einfach, was die Konsole nach Enter ausgibt (erste paar Zeilen).

Tatsächlich tut sich auch was, siehe Bild, is nen bischen klein, aber nur zum Zeigen: es ist die 324 Dokus durchgegangen, hat aber nur meine 2 Tags nicht gesetzt

Ashampoo_Snap_Freitag, 13. Februar 2026_12h54m57s_001_Portainer local - Brave.png

Ist das alles richtig soweit?
 
Ich verstehe noch immer nicht ganz, was du machen möchtest, aber meines Erachtens kann das Paperless auch direkt (ohne Kommandozeile):
- "Dokumente" wählen in linker Spalte
- Dokumente markieren (10, 50 oder auch alle)
- Auf der rechten Seite oben "Aktionen" auswählen, da findet sich der Punkt "Erneut verarbeiten"
 
Ich möchte gerne meine sämtlichen Dokumente neu taggen, zumal ich meine bisherigen Tags alle gelöscht habe.

Habe jetzt zB per Dokumenttyp "Einkommensteuer-Bescheid", Zuweisung Irgendein Wort: Einkommensteuerbescheid, 7 Dokumente rausgefiltert. Diese sollen mit dem Tag "Finanzamt", Irgendein Wort, Zuweisungsmuster "Einkommensteuerbescheid" automatisch getagged werden.
Das mit dem "Erneut verarbeiten" hatte ich auch schon gefunden, hat bei mir leider keine Auswirkung; wahrscheinlich wg. fehlerhafter Bedienung. Welche?
 
Wenn die Dokumente schon in Paperless sind und mit dem Dokumenttyp Einkommenssteuer-Bescheid markiert sind, dann kannst du ganz einfach einen Tag zuweisen:
- Tag "Finanzamt" anlegen
- Auf "Tags" in linker Spalte gehen, dann auf Dokumente mit dem Dokumenttyp "Einkommenssteuer-Bescheid" klicken
- Nun solltest du alle Dokumente mit de Typ "Einkommenssteuer-Bescheid" sehen.
- oben auswählen "Alle"
- dann unter Dropdown "Tags" den Tag "Finanzamt" auswähen.

So werden alle ausgewählten Dokumente mit dem Tag Finanzamt versehen.
 
Altaaaaaaaaaaaa :)))))) war/ist das gut. On Anhieb geklappt...Da hab ich wohl -mal wieder-viel zu kompliziert gedacht, hahaha.

So, nach der grossen Freude, folgende Ernüchterung, erstmal:
Betrachte mir gerade die Gesamtheit meiner Dokumente und filtere nach "Rechnung", bleiben 61 übrig, davon sind - für mich unerklärlicherweise- 7 Stück getagged mit "Finanzamt" und "Rechnung".....und 8 mit "Rechnung", diese 8 enthalten die vorher beschriebenen 7; 1 zusätzlicher, welcher sachlich korrekt ist (tatsächlich eine Rechnung)...Hoffe, ist verständlich , was ich sagen will.
Jetzt aber: wenn ich die Tags löschen will: egal, ob die mit der Kombi "Finanzamt/Rechnung" oder auch die einzelne Rechnung, die Tags lassen sich nicht löschen. Ich entferne sie, drücke auf "speichern", im nächsten Moment sind sie wieder da...any idea?
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat