Seite 67 von 67 ErsteErste ... 1757656667
Ergebnis 661 bis 669 von 669
  1. #661

    Standard

    Danke - Kein Problem! Ich bin froh, dass ich keine Texterkennung von Hand machen muss! Und mit der Volltextsuche finde ich trotzdem die Dokumente die ich brauche!

  2. #662
    Anwender
    Registriert seit
    20.02.2020
    Beiträge
    1

    Standard

    Vielen Dank für das schöne Package!

    Ich hab für's renaming bei mir noch folgendes in's Script gepackt:

    header=$(head -n 1 $searchfile | sed "s/[^[:alpha:].-]//g")

    Bin noch nicht 100% zufrieden mit dem Ergebnis (will noch so Sachen ausprobieren wie "Nehme die ersten 5 Wörter" statt die erste Zeile, und am sed pattern sollte man auch noch schrauben), aber bei Dateinamen wie "2020-02-20_InformationzurVerarbeitungIhrerDaten_BRWC0B5D72 AAF07_...." hab ich jetzt schon ein bisschen mehr Ahnung um was es sich in der Datei handelt (ohne Tags zu konfigurieren)

    Wäre ja vielleicht auch ne Idee für das offizielle Release

  3. #663
    Anwender
    Registriert seit
    17.03.2008
    Beiträge
    12

    Standard

    Hi,
    erstmal Danke an das Package auch von mir.
    Mein zu suchende TAGs sind die Folgenden:

    Rechnung;Arbeit;Versicherung;

    Es wäre hilfreich, wenn hier case sensitive gesucht werden würde,
    In meinem Fall, ein Infoschreiben, wurde im Dateinamen mit Arbeit umbenannt, weil im PDF "Bearbeitungs-Nr. " gefunden wurde.

    Ist das möglich, die Tags case sensitive (evtl. auch über ein separten Flag) umzusetzen?

    Vielen Dnak im Voraus.
    Mit freundlichen Grüßen
    DS212 mit 2* HD154UI 1,5TB @DSM4.3-3750

  4. #664

    Standard

    Du kannst mit vorangestelltem Paragrafenzeichen (§) die exakte Schreibweise definieren, was den Paramter -w für grep setzt:
    Code:
    -w, --word-regexp         force PATTERN to match only whole words
    Rechnung;§Arbeit;Versicherung; würde also in deinem Fall zum gewünschten Ergebnis führen. Unabhängig davon ist die Suche case insensetiv.
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.15

  5. #665

    Standard

    Zitat Zitat von floflo Beitrag anzeigen
    … Ich hab für's renaming bei mir noch folgendes in's Script gepackt:
    header=$(head -n 1 $searchfile | sed "s/[^[:alpha:].-]//g")

    Wäre ja vielleicht auch ne Idee für das offizielle Release
    Das ist eine schöne Idee, aber bei mir waren die Ergebnisse zu wenig hilfreich. Sollte die Tagerkennung in Zukunft umfangreicher gestaltet werden können, wäre diese sicherlich die zielführendere Lösung für aussagekräftige Dateinamen.

    Vielen Dank fürs Gedanken-machen - ich freue mich immer über Input
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.15

  6. #666
    Anwender
    Registriert seit
    24.09.2018
    Beiträge
    3

    Standard

    Hi, erstmal super und Danke für das Klasse Tool! Donation ging auch schon raus

    Mal eine Frage: Gibt es irgendwo ein paar Presets für die Tags an denen man sich etwas orientieren kann bzw. was Sinn macht?
    Tu mir gerade schwer ein richtiges Konzept aufzubauen. (Habe jetzt auch nicht alle Seiten durchgelsen)

    Danke im Voraus!

  7. #667

    Standard

    Danke für synOCR.

    Versuche mich gerade ein bisschen "einzufuchsen". Ich habe einen großen Berg Papier zu digitalisieren. Würde gerne alle Dokumente in einem Rutsch scannen und dann von synOCR nicht nur umbenennen und verschlagworten, sondern auch in einzelne PDFs nach bestimmten Kriterien splitten lassen. Beispiel: Jede Seite nacheinander durchsuchen und wenn bestimmte Worte oder Wortfolgen auf dieser Seite zu finden sind, dann jeweils splitten. Beispiele: "Sehr geehrter Herr Mayer", "Sehr geehrte Frau Mustermann", "Rechnung", Die Einzeldokumente dann ganz normal weiterverarbeiten (umbenennen und verschlagworten).

    Workflow also: 50 Seiten Scannen in eine Datei Scan_001.pdf --> Anhand der Wortliste in einzelne PDF splitten (z.B. in Scan_001_Teil_1) --> Einzelne PDF wie gewohnt in synOCR umbenennen und verschlagworten.

    Genial wäre es noch, die fertigen PDFs in eine eigene Dokumentenstruktur zu verschieben.

    Hat da schon jemand in diese Richtung etwas gebastelt?

  8. #668

    Standard

    Zitat Zitat von Zer0x Beitrag anzeigen
    …Mal eine Frage: Gibt es irgendwo ein paar Presets für die Tags an denen man sich etwas orientieren kann bzw. was Sinn macht?…
    Das lässt sich schwer pauschalisieren. Es kommt halt auf deinen Content an. Speziellen Sachen weise ich eine Kategorie zu ( …;Tag=Kategorie_so_und_so;…). Z.B. kommt alles, was zu einer Versicherung gehört, in einen eigenen Ordner ( …;Allianz=Versichung;1 00 23 785=Versicherung;HUK24=Versicherung;…)

    Das Tagging soll ja möglichst in Zukunft auch noch variabler werden …
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.15

  9. #669

    Standard

    Zitat Zitat von Species8472 Beitrag anzeigen
    … Würde gerne alle Dokumente in einem Rutsch scannen und dann von synOCR nicht nur umbenennen und verschlagworten, sondern auch in einzelne PDFs nach bestimmten Kriterien splitten lassen. …
    Ich bin gerade am Sondieren bzgl. des splitten. D.h. aktuell geht es so noch nicht. Du müsstest also jedes Dokument einzeln scannen. Der Aufwand ist beim Einstieg ins papierlose Büro sicherlich erhöht, aber im Alltag spielt es wahrscheinlich keine große Rolle, ob man Dokumente einzeln oder auf einmal scannt.

    … Beispiel: Jede Seite nacheinander durchsuchen und wenn bestimmte Worte oder Wortfolgen auf dieser Seite zu finden sind, dann jeweils splitten. Beispiele: "Sehr geehrter Herr Mayer", "Sehr geehrte Frau Mustermann", "Rechnung",…
    Das sehe ich problematisch. Auf diese Art würden sicherlich viele mehrseitige Dokumente zerstört, weil nicht auf jeder Seite alle Merkmale vorhanden sind.
    Wahrscheinlich wird der User in Keyword definieren können, bei welchem ein Split erfolgt (Separator sheet). Leerseiten wären auch eine Möglichkeit, wenn auch aufwändiger und unsicherer.
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.15

Seite 67 von 67 ErsteErste ... 1757656667

Ähnliche Themen

  1. Docker Problem Berechtigung Ocrmypdf
    Von Huhie im Forum Docker
    Antworten: 1
    Letzter Beitrag: 05.12.2018, 21:21
  2. GUI für Docker?
    Von Bullitt66 im Forum Docker
    Antworten: 4
    Letzter Beitrag: 30.03.2016, 10:09
  3. Web-Gui für Streamripper
    Von MoleWindu im Forum Andere 3rd Party Anwendungen
    Antworten: 0
    Letzter Beitrag: 21.05.2013, 10:47
  4. GUI für Dateibehandlung per ssh?
    Von auflauf im Forum Terminal-Dienste (Telnet, SSH) - Linux-Konsole
    Antworten: 4
    Letzter Beitrag: 25.10.2010, 09:15
  5. GUI für Dateibehandlung per ssh?
    Von auflauf im Forum Installation und Konfiguration allgemein
    Antworten: 4
    Letzter Beitrag: 25.10.2010, 09:15

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •