Seite 2 von 22 ErsteErste 123412 ... LetzteLetzte
Ergebnis 11 bis 20 von 212
  1. #11

    Standard

    Hallo Mike,

    eigentlich solltest du lediglich das Paket "Docker" installiert haben, synOCR startet dann den Container jbarlow83/ocrmypdf. Ggf. wird das entsprechende Abbild vorher geladen. Der Container wird nicht dauerhaft laufen (dafür ist er nicht gebaut).
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.14

  2. #12
    Anwender Avatar von Mike0185
    Registriert seit
    26.06.2012
    Beiträge
    407

    Standard

    Danke Stephan! Gerade habe ich es gelesen in einem anderen Thread!

    Und siehe da: Funktioniert alles auf Anhieb!
    DS-918+ | 16GB | 2x3TB WD30EZRX | 2x1TB CT1000MX500 SSD | 2x256GB 970 EVO SSD-Cache | 24/7
    ISP: Unitymedia Business 200/20 IPv4 | Switch: Unifi US-24-250 | APs: Unifi AP AC Pro

  3. #13
    Anwender Avatar von peterhoffmann
    Registriert seit
    17.12.2014
    Beiträge
    1.896

    Standard

    Zitat Zitat von geimist Beitrag anzeigen
    Code:
    stat -c %s "/volume … /zieldatei.pdf"
    Bei allen sieben PDFs eine 0.
    Code:
    root@DS216+ /volume1/temp/scanner/2_ausgang $ stat -c %s OCR_testdatei1.pdf
    0
    Zitat Zitat von geimist Beitrag anzeigen
    Ist bei den entsprechenden PDFs etwas besonderes?
    Ich bin nicht der PDF-Profi und kann das nicht beurteilen. Auch die Fehlermeldungen sind ja teilweise verschieden (siehe Log im Vorposting).
    Die testdatei1.pdf beinhaltet eine Zeichnung und unverfänglichen Text. Die Datei habe ich dir gezippt und anbei gelegt. Vielleicht weißt du woran es liegt.
    Zusätzlich liegt die OCR_testdatei1.pdf auch mit drin.
    Angehängte Dateien Angehängte Dateien
    Viele Grüße,
    Peter

    DS216+
    mit 8GB u. Noctua
    | |
    | |
    | |
    | |
    | |
    O AvrLogger für Synology DS
    Temperaturen, Netzwerk- und HDD-Aktivität fest im Blick
    O Ultimate Backup
    Backup von Daten leichtgemacht
    O synOCR - GUI
    Verarbeitung von PDFs

  4. #14

    Standard

    Zitat Zitat von peterhoffmann Beitrag anzeigen
    Bei allen sieben PDFs eine 0.
    Sehr schön. Die andere Methode gibt wohl die Größe in Blöcken aus und nicht in Bytes. Sollte im nächsten Release behoben sein.

    Ich bin nicht der PDF-Profi und kann das nicht beurteilen. Auch die Fehlermeldungen sind ja teilweise verschieden (siehe Log im Vorposting).
    Die testdatei1.pdf beinhaltet eine Zeichnung und unverfänglichen Text. Die Datei habe ich dir gezippt und anbei gelegt. Vielleicht weißt du woran es liegt.
    Zusätzlich liegt die OCR_testdatei1.pdf auch mit drin.
    Deine PDF ist verschlüsselt und lässt sich nicht modifizieren. Da kann ich nichts machen. Unerklärlicher für mich sind die anderen Fehler in dem Log die so oder ähnlich lauten:
    ValueError: time data '201405211108390100' does not match format '%Y%m%d%H%M%S%z'
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.14

  5. #15
    Anwender Avatar von mördock
    Registriert seit
    04.01.2012
    Beiträge
    650

    Standard

    Nabend,
    Irgendwas mache ich wohl falsch
    Docker läuft, ocrmypf liegt als Abbild im Docker, synocr ist installiert und Einstellungen sind vorgenommen worden. Unter Status zeugt er mir das 9 PDF Dateien vorhanden sind die verarbeitet werden können. Starte ich den Vorgang wird mir angezeigt das die Daten verarbeitet werden. Mach wenigen Sekunden scheint alles fertig zu sein, aber es wurden keine Dateien verarbeitet. Synocr zeigt mir noch immer 9 zu verarbeitende Dateien an. Es wird lediglich eine leere Log Datei angelegt.
    Wo könnte es wohl dran liegen?
    DS 216+ DSM 6.2.1-23824 U4 (SHR mit 1 * 3 TB & 1 * 6 TB WD red). Aktiv genutztes NAS
    DS 118 DSM 6.2.1-23824 U4 (6 TB WD red). Externes Sicherungsziel für die DS 216+ und dort gleichzeitig aktiv genutztes NAS
    DS 111 DSM 6.2.1-23824 U4 (6 TB WD red). Datensicherungsziel der DS 111 und DS 118
    APC Back-UPS BX700U-GR, Fritzbox 7490 für's Internet und Fritzbox 7390 als access point.

  6. #16

    Standard

    Ein leeres Log macht es mir ja auch nicht unbedingt leichter …

    Du könnest mal bitte synOCR über die Konsole starten:
    Code:
    /usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh
    Sofern du dich damit nicht auskennst, kannst du auch über den Aufgabenplaner einen benutzerdefinierten Task mit obigen Befehl erstellen, einmalig ausführen und anschließend das Ergebnis ausgeben lassen.

    Danke
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.14

  7. #17
    Anwender Avatar von mördock
    Registriert seit
    04.01.2012
    Beiträge
    650

    Standard

    Moin,

    werde mal versuchen den Code auszuführen, allerdings werde ich da vermutlich nicht die nächsten Tage zu kommen.
    Melde mich dann.

    #Mördock#

    PS: Auf sowas wie SynOCR warte ich schon lange. Vielen Dank Geimist das Du Dir die Arbeit damit machst.
    DS 216+ DSM 6.2.1-23824 U4 (SHR mit 1 * 3 TB & 1 * 6 TB WD red). Aktiv genutztes NAS
    DS 118 DSM 6.2.1-23824 U4 (6 TB WD red). Externes Sicherungsziel für die DS 216+ und dort gleichzeitig aktiv genutztes NAS
    DS 111 DSM 6.2.1-23824 U4 (6 TB WD red). Datensicherungsziel der DS 111 und DS 118
    APC Back-UPS BX700U-GR, Fritzbox 7490 für's Internet und Fritzbox 7390 als access point.

  8. #18
    Anwender Avatar von mördock
    Registriert seit
    04.01.2012
    Beiträge
    650

    Standard

    Moin,

    meine DS darf nachts ausgehen, habe dann eben nochmal einen Anlauf unternommen PDF Dateien zu bearbeiten und siehe da....... Es klappt. Genial, und so einfach!!

    Jetzt muss ich mir noch überlegen wie ich meine vorhandenen Dateien am besten bearbeite. Schön wäre es wenn ich einfach einen Ordner nehmen könnte und er lediglich zu jeder vorhandenen Datei eine weitere, bearbeitete legt, ohne die Alte zu löschen oder zu verschieben. Mal schauen was sich mit den Einstellungen und Präfixen für eine Arbeitsablauf organisieren lässt.

    Hinweis: Ein Hinweistext bei der Konfiguration wird falsch angezeigt. Geht man mit der Maus auf das "i" hinter der Zeile "Systembenachrichtigung (Piep) wir einem angezeigt: Ein kurzer Piep, sobald ein Film fertig bearbeitet wurde.

    #Mördock#
    DS 216+ DSM 6.2.1-23824 U4 (SHR mit 1 * 3 TB & 1 * 6 TB WD red). Aktiv genutztes NAS
    DS 118 DSM 6.2.1-23824 U4 (6 TB WD red). Externes Sicherungsziel für die DS 216+ und dort gleichzeitig aktiv genutztes NAS
    DS 111 DSM 6.2.1-23824 U4 (6 TB WD red). Datensicherungsziel der DS 111 und DS 118
    APC Back-UPS BX700U-GR, Fritzbox 7490 für's Internet und Fritzbox 7390 als access point.

  9. #19
    Anwender Avatar von peterhoffmann
    Registriert seit
    17.12.2014
    Beiträge
    1.896

    Standard

    Dank naps2 (Scannersoftware) habe ich jetzt einen guten Workflow gefunden. Per Knopfdruck am Scanner wird das Dokument (ohne OCR) auf dem NAS abgelegt, alle 5min (von 9 bis 21 Uhr) prüft ein Script, ob ein Dokument vorhanden ist, wenn ja, wird synOCR in Gang gesetzt, OCR läuft drüber und legt das Dokument im endgültigen Ordner ab.

    @geimist
    1. Ist es in Zukunft geplant, dass kein Log angelegt wird, wenn kein Dokument bearbeitet wird? Das war nämlich jetzt mein Problem, wenn ich das Script alle 5min starte. So habe ich mir hilfsweise eine Abfrage gebaut, die prüft, ob überhaupt ein Dokument vorhanden ist.
    2. Ist es in Zukunft geplant die Anzahl der Backupdateien zu begrenzen (ähnlich wie bei Logs)? Wenn nein, muss ich da noch ein Script drüberlaufen lassen, was ab einer gewissen Anzahl die Dateien löscht.




    Nachtrag:
    Mir ist ein Fehler bei der Bennung aufgefallen. Beim Testen hatte ich zufällig zwei Dokumente (20190117_2.pdf und 20190117_.pdf) im Eingangsordner.
    Daraus wurden dann "20190117_2.pdf" und "20190117_ (2).pdf".

    Log:
    Code:
        VERARBEITE:       --> 20190117_2.pdf (Thu Jan 17 11:28:17 CET 2019)
    
    OCRmyPDF-LOG:
       INFO - reading file from standard input
       INFO -    1: page is facing ⇧, confidence 4.94 - no change
       INFO - Optimize ratio: 1.00 savings: 0.0%
       INFO - Output sent to stdout
    
                          --> übertrage die Dateirechte und -besitzer
                          --> verschiebe Quelldatei nach: /volume1/.../scanner/3_backup/20190117_2.pdf
                          --> 315 PDFs bisher verarbeitet
            (PushBullet-TOKEN nicht gesetzt)
                          --> (Laufzeit: 25 Sekunden)
    
        VERARBEITE:       --> 20190117_.pdf (Thu Jan 17 11:28:42 CET 2019)
    
    OCRmyPDF-LOG:
       INFO - reading file from standard input
       INFO -    1: page is facing ⇧, confidence 2.50 - no change
    WARNING -    1: [tesseract] unsure about page orientation
       INFO - Optimize ratio: 1.00 savings: 0.0%
       INFO - Output sent to stdout
    
                          --> übertrage die Dateirechte und -besitzer
                          --> verschiebe Quelldatei nach: /volume1/.../scanner/3_backup/20190117_ (2).pdf
                          --> 316 PDFs bisher verarbeitet
            (PushBullet-TOKEN nicht gesetzt)
                          --> (Laufzeit: 21 Sekunden)
    Geändert von peterhoffmann (17.01.2019 um 11:45 Uhr)
    Viele Grüße,
    Peter

    DS216+
    mit 8GB u. Noctua
    | |
    | |
    | |
    | |
    | |
    O AvrLogger für Synology DS
    Temperaturen, Netzwerk- und HDD-Aktivität fest im Blick
    O Ultimate Backup
    Backup von Daten leichtgemacht
    O synOCR - GUI
    Verarbeitung von PDFs

  10. #20

    Standard

    synOCR v0.9.3 ist online

    IMPLEMENTIERUNGEN:
    - Dateisuche ist jetzt case insensetive (Suchpräfix / .pdf .PDF)
    - Suchpräfix kann nun automatisch entfernt werden lassen
    BUGFIXES:
    - leere LOGs wurden z.T. nicht korrekt gelöscht
    - bei einem OCRmyPDF Error wurde das Skript z.T. nicht korrekt abgebrochen
    - kleinere Korrekturen



    Zitat Zitat von mördock Beitrag anzeigen
    … Jetzt muss ich mir noch überlegen wie ich meine vorhandenen Dateien am besten bearbeite. Schön wäre es wenn ich einfach einen Ordner nehmen könnte und er lediglich zu jeder vorhandenen Datei eine weitere, bearbeitete legt, ohne die Alte zu löschen oder zu verschieben. Mal schauen was sich mit den Einstellungen und Präfixen für eine Arbeitsablauf organisieren lässt.
    Du musst in jeden Fall die zu bearbeitenden Dateien mit einem Präfix versehen (z.B. gleich beim Scannen). In Version 0.9.3 lässt sich nun auch dieses Präfix automatisch entfernen > bearbeitete Dokumente werden also nicht mehr berücksichtigt (kann sein, dass ich den Zähler der offenen Aufgaben auf der Statusseite dafür noch sensibilisieren muss).
    Hinweis: Ein Hinweistext bei der Konfiguration wird falsch angezeigt. …
    Film wurde im aktuellen Release schon zum File - Danke



    Zitat Zitat von peterhoffmann Beitrag anzeigen
    1. Ist es in Zukunft geplant, dass kein Log angelegt wird, wenn kein Dokument bearbeitet wird? Das war nämlich jetzt mein Problem, wenn ich das Script alle 5min starte. So habe ich mir hilfsweise eine Abfrage gebaut, die prüft, ob überhaupt ein Dokument vorhanden ist.
    Das Löschen von Logs ohne Dateibearbeitung sollte in der aktuellen Version besser funktionieren. Vielleicht werde ich in Zukunft im Startskript eine Prüfung auf zu bearbeitende Dokumente einbauen, sodass das Hauptskript erst gar nicht anläuft. Dabei gibt es dann keinerlei Logs, was ich am Anfang vermeiden wollte.
    1. Ist es in Zukunft geplant die Anzahl der Backupdateien zu begrenzen (ähnlich wie bei Logs)? Wenn nein, muss ich da noch ein Script drüberlaufen lassen, was ab einer gewissen Anzahl die Dateien löscht.
    Das habe ich derzeit nicht geplant. Man kann ja auch in den Systempapierkorb 'backupen' lassen. Sollte das dringend benötigt werden, lasse ich mich auch gerne erweichen
    Mir ist ein Fehler bei der Bennung aufgefallen. Beim Testen hatte ich zufällig zwei Dokumente (20190117_2.pdf und 20190117_.pdf) im Eingangsordner.
    Daraus wurden dann "20190117_2.pdf" und "20190117_ (2).pdf".
    Es wird geprüft, ob es den vollen Dateinamen (20190117_) bereits gibt (ja > 20190117_2.pdf). Deshalb der Zähler hinten dran. Mir war schon klar, dass es da Sonderkonstallationen geben könnte, aber dass die so schnell auftauchen … Dazu müsste ich das härter prüfen.
    Geändert von geimist (17.01.2019 um 15:33 Uhr) Grund: Rechtschreibung
    Gruß Stephan
    ________________________________________
    DS716+ DSM 6.2 - 2 x 4TB WD red (Btrfs RAID-1)
    DX213 1 x Samsung EVO 860 500 GB SSD (Btrfs Basis)
    APC - Back-UPS ES 550G
    AVM Fritz!BOX 7590
    macOS 10.14

Seite 2 von 22 ErsteErste 123412 ... LetzteLetzte

Ähnliche Themen

  1. Docker Problem Berechtigung Ocrmypdf
    Von Huhie im Forum Docker
    Antworten: 1
    Letzter Beitrag: 05.12.2018, 21:21
  2. GUI für Docker?
    Von Bullitt66 im Forum Docker
    Antworten: 4
    Letzter Beitrag: 30.03.2016, 10:09
  3. Web-Gui für Streamripper
    Von MoleWindu im Forum Andere 3rd Party Anwendungen
    Antworten: 0
    Letzter Beitrag: 21.05.2013, 10:47
  4. GUI für Dateibehandlung per ssh?
    Von auflauf im Forum Terminal-Dienste (Telnet, SSH) - Linux-Konsole
    Antworten: 4
    Letzter Beitrag: 25.10.2010, 09:15
  5. GUI für Dateibehandlung per ssh?
    Von auflauf im Forum Installation und Konfiguration allgemein
    Antworten: 4
    Letzter Beitrag: 25.10.2010, 09:15

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •