synOCR synOCR - GUI für OCRmyPDF

mlanger · 03. Aug. 2025

Das hat jetzt besser geklappt, auch mit größeren (mehrseitigen) Dokumenten. ich beobachte das Thema weiter aber schon mal vielen Dank für den Unterstützung. Schönen Sonntag! Viele Grüße Martin

geimist · 03. Aug. 2025

Das wäre in der Tat eine mögliche Ursache. Ich hoffe, dass dem so ist.

Zu deiner vorhergehenden Frage, es wird hier installiert:

/volume{dein Installationsvolume für das Paket}/@appstore/synOCR

Ein eindeutiger Link wird hier erstellt:

/usr/syno/synoman/webman/3rdparty/synOCR/

Die Paketdateien (Config für das DSM) liegt hier:

/var/packages/synOCR/

Ich wünsche dir auch einen schönen Sonntag

bami535 · 04. Aug. 2025

stehe aktuell vor dem Problem das ich zwar die Titel wie gewünscht per Tags ändern kann. Jedoch werden viele dadurch Gleich benannt.

Kann ich z.B. die Rechnungsnummer in den Titel mit aufnehmen lassen? wenn ja wie?

mic777 · 04. Aug. 2025

Hallo,
zu den Inotify-Tools DSM7.x gibt es mehrere Architekturen.
Woher weiß ich denn welche zu mir passt.
Ich habe die RS822+ mit Ryzen V1500B.
Würde mich über jede Antwort freuen.
Gruß Mic

geimist · 04. Aug. 2025

Idealerweise installierst du synocommunity wie auf deren Website beschrieben im Paketzentrum als Paketquelle. Dann wird dir immer die passende Version angezeigt.

Alternativ:
Suche hier über dein Modell deine Architektur: https://kb.synology.com/de-de/DSM/tutorial/What_kind_of_CPU_does_my_NAS_have
Bei dir ist das v1000. Die x86_64 Pakete sind aber in der Regel alle identisch.

Struppix · 04. Aug. 2025

bami535 schrieb:
Kann ich z.B. die Rechnungsnummer in den Titel mit aufnehmen lassen? wenn ja wie?

Hallo,
willkommen im Forum.
Zum Verständnis: Du nutzt die Tags im Feld der GUI, richtig? Normalerweise werden die Dokumente dann per Datum differenziert, so auch die Philosophie der Umbenennung.
Ist ein Dokument dennoch mal gleich benannt, wird es per Zähler gekennzeichnet.

Wenn Du komplexere Umbenennungen haben möchtest, kommst Du um die Verwendung ein YAML-Datei nicht umhin.
Gruß
Karsten

geimist · 04. Aug. 2025

Struppix schrieb:
Wenn Du komplexere Umbenennungen haben möchtest, kommst Du um die Verwendung ein YAML-Datei nicht umhin.

➜ https://github.com/geimist/synOCR/wiki/03_YAML-(de)#regex-regel---spezielle-abfragen

HUHA · 09. Aug. 2025

Hello.
Does anyone know a free android application with which I can take photos of receipts and save them in specific directories in the android phone? And those directories will be synchronized with directories on my nas where synocr will process those pdf and renamed them .
If you know a tested solution for this.
Thank you.

Ponti · 17. Aug. 2025

Hallo in die Runde,

ich habe auf die aktuelle Version geupdated. Seitdem habe ich das Problem, dass nachdem die synOCR lief und die Datei erfolgreich Eingelesen und bearbeitet hat ich eine Meldung bekomme, dass der Container SynOCR unerwartet beendet wurde. Hat evtl. jemand Hinweise, woran es liegen könnte und wie ich die Meldung deaktiviert bekomme?
Danke euch!

geimist · 18. Aug. 2025

Im Wiki gibt es einen Eintrag dazu: Warum erhalte ich die Fehlermeldung "Container synOCR in Container Manager wurde unerwartet beendet."?

Ponti · 18. Aug. 2025

Super, hatte ich nicht gefunden - besten dank!

kshb · 14. Sep. 2025

Hallo zusammen, ich muss noch mal auf eine Problematik mit dirname_RegEx zurückkommen. Ich habe die Regel wie folgt definiert:

Ich bekomme hier das Jahr und den Monat aus dem Dokument - das klappt bei tagname auch wunderbar.
Gebe ich aber §dirname_RegEx unter targetfolder mit an, werden Fehler-Ordner erstellt:

Hat jemand eine Idee, woran das liegen kann?

Nutze synOCR erst seit ein paar Stunden und habe mit RegEx auch noch nie zutun gehabt und mich gefreut, dass so viele Regeln doch funktionieren. Da will ich nicht, dass es daran scheitert

Danke Euch vorab für eine vielleicht etwas anfängerfreundliche Hilfestellung - KI dreht sich im Kreis

geimist · 14. Sep. 2025

Da hab ich einen kleinen Fehler gefunden.
Bitte installiere mal diese Version und schreib bitte, ob es damit geht.

kshb · 14. Sep. 2025

So funktioniert's. Super! Besten Dank

geimist · 14. Sep. 2025

An alle, die die Polyglot-Images (d.h. OCRmyPDF mit allen tesseract-Sprachen) nutzen:
Diese stehen jetzt auch für ARM64 zur Verfügung.

FoxageX · 15. Sep. 2025

Hallo an alle,

gibt es eine Möglichkeit, die Größe der auszugebenden PDF-Datei auf eine feste Größe, z. B. auf A4, zu bestimmen? So sollen die auszugebenden Dateien eine definierte Größe bekommen unabhängig davon, in welcher Größe der Original-Scan ist. Danke für eure Ideen und Hinweise.

geimist · 15. Sep. 2025

Nein, da gibt es meines Wissens keinen Schalter für OCRmyPDF. Da die nötigen Tools aber bereits durch synOCR installiert sind, kannst mit einem kleinen Hilfskript deine Dateien konvertieren. Dazu müsstest du halt in einen vorgelagerten Ordner scannen und daraus deine Dateien mit dem Skript in den synOCR-Inputordner verarbeiten.

(Das Skript war jetzt nur ein schneller Versuch und bei mir einen Kassenbon wie gewünscht auf A4 skaliert.)

Bash:

konvertierskript="/volumeX/path/pdf2a4.py"
quelldatei="/volumeX/path/input.pdf"
zieldatei="/volumeX/path/output.pdf"

source /usr/syno/synoman/webman/3rdparty/synOCR/python3_env/bin/activate # nutze die installierten Module
python3 "$konvertierskript" "$quelldatei" "$zieldatei"
deactivate

Python:

import sys
import fitz  # PyMuPDF

# A4 in Punkten (1pt = 1/72 inch)
A4_WIDTH = 595.276  # 210 mm
A4_HEIGHT = 841.890 # 297 mm

def normalize_to_a4(input_file, output_file):
    doc = fitz.open(input_file)
    new_doc = fitz.open()

    for page in doc:
        rect = page.rect
        scale_x = A4_WIDTH / rect.width
        scale_y = A4_HEIGHT / rect.height
        scale = min(scale_x, scale_y)  # proportional skalieren

        # Neue A4-Seite
        new_page = new_doc.new_page(width=A4_WIDTH, height=A4_HEIGHT)

        # Skalierungsmatrix
        matrix = fitz.Matrix(scale, scale)

        # Offsets (in Zielkoordinaten)
        x_offset = (A4_WIDTH - rect.width * scale) / 2
        y_offset = (A4_HEIGHT - rect.height * scale) / 2

        # Translation-Matrix erzeugen und mit Skalierung kombinieren
        translate = fitz.Matrix(1, 0, 0, 1, x_offset, y_offset)
        matrix = matrix * translate  # erst skalieren, dann verschieben

        new_page.show_pdf_page(new_page.rect, doc, page.number, matrix=matrix)

    new_doc.save(output_file)
    new_doc.close()
    doc.close()


if __name__ == "__main__":
    if len(sys.argv) != 3:
        print("Usage: python pdf2a4.py input.pdf output.pdf")
        sys.exit(1)

    input_file = sys.argv[1]
    output_file = sys.argv[2]
    normalize_to_a4(input_file, output_file)

LAR_Hamburg · 28. Sep. 2025

Moin zusammen,
Spannend das es bereits 246 pages zu dem Thema synOCR gibt und wie man das meiste aus dem Tool heraus kitzeln kann. Ich habe es leider bisher noch überhaupt nicht ans Laufen gekriegt. x-mal de-/installiert, sämtliche Tutorials geschaut und langsam bin ich mit dem Latein am Ende. Pfade sind alle korrekt.
Sobald ich ein Profil aktiviere, wird die blaue Sanduhr angezeigt und bei Ausführung ein Haufen Fehler in das Log-file geschrieben.

ERROR at line 2881: prepare_python_log=$(prepare_python)
ERROR at line 1310: tmp_log1=$(python3 -m pip install "${module}")
ERROR at line 1310: python3 -m pip install "${module}"
ERROR at line 2881: return 1
ERROR at line 2397: pageCount=$( py_page_count "${outputtmp}" )

Von den Tag-Errors ganz zu schweigen ..

@geimist: wärest du so nett und würdest dir das Logfile einmal zu Herzen nehmen?

DS725+ // AMD R1600 // 2.6GHz // RAM 4096MB

geimist · 28. Sep. 2025

Zunächst ein herzliches Willkommen hier im Forum

LAR_Hamburg schrieb:
@geimist: wärest du so nett und würdest dir das Logfile einmal zu Herzen nehmen?

Es guck mir das gern an. Eigentlich sind die x86_64 Geräte ziemlich entspannt in ihrer Kompatibilität. Auf einigen DS925er läuft es auch augenscheinlich.
Bitte lass mir doch das gesamte Log mal zukommen. Bei dir scheint es bereit beim Erstellen der virtuellen Pythonumgebung zu klemmen (1x nach einer Installation erforderlich).

geimist · 29. Sep. 2025

Hallo @LAR_Hamburg,
bitte installiere mal DIESE Version und gib mir bitte Feedback. Wenn es läuft, aktualisiere ich das Paket für alle.

Offensichtlich gab es durch externe Updates von Pythonmodulen eine Inkompatibilität. Dein Fehler hat ziemlich sicher jede Neuinstallation betroffen.

synOCR synOCR - GUI für OCRmyPDF

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Benutzer

Anhänge

Benutzer

Benutzer

Benutzer

Additional post fields

Kaffeautomat