synOCR synOCR - GUI für OCRmyPDF

  • Ab sofort steht euch hier im Forum die neue Add-on Verwaltung zur Verfügung – eine zentrale Plattform für alles rund um Erweiterungen und Add-ons für den DSM.

    Damit haben wir einen Ort, an dem Lösungen von Nutzern mit der Community geteilt werden können. Über die Team Funktion können Projekte auch gemeinsam gepflegt werden.

    Was die Add-on Verwaltung kann und wie es funktioniert findet Ihr hier

    Hier geht es zu den Add-ons

Das hat jetzt besser geklappt, auch mit größeren (mehrseitigen) Dokumenten. ich beobachte das Thema weiter aber schon mal vielen Dank für den Unterstützung. Schönen Sonntag! Viele Grüße Martin
 
Das wäre in der Tat eine mögliche Ursache. Ich hoffe, dass dem so ist.

Zu deiner vorhergehenden Frage, es wird hier installiert:
/volume{dein Installationsvolume für das Paket}/@appstore/synOCR
Ein eindeutiger Link wird hier erstellt:
/usr/syno/synoman/webman/3rdparty/synOCR/

Die Paketdateien (Config für das DSM) liegt hier:
/var/packages/synOCR/

Ich wünsche dir auch einen schönen Sonntag 🙋‍♂️
 
stehe aktuell vor dem Problem das ich zwar die Titel wie gewünscht per Tags ändern kann. Jedoch werden viele dadurch Gleich benannt.

Kann ich z.B. die Rechnungsnummer in den Titel mit aufnehmen lassen? wenn ja wie?
 
Hallo,
zu den Inotify-Tools DSM7.x gibt es mehrere Architekturen.
Woher weiß ich denn welche zu mir passt.
Ich habe die RS822+ mit Ryzen V1500B.
Würde mich über jede Antwort freuen.
Gruß Mic
 
Idealerweise installierst du synocommunity wie auf deren Website beschrieben im Paketzentrum als Paketquelle. Dann wird dir immer die passende Version angezeigt.

Alternativ:
Suche hier über dein Modell deine Architektur: https://kb.synology.com/de-de/DSM/tutorial/What_kind_of_CPU_does_my_NAS_have
Bei dir ist das v1000. Die x86_64 Pakete sind aber in der Regel alle identisch.
 
  • Like
Reaktionen: mic777
Kann ich z.B. die Rechnungsnummer in den Titel mit aufnehmen lassen? wenn ja wie?
Hallo,
willkommen im Forum.
Zum Verständnis: Du nutzt die Tags im Feld der GUI, richtig? Normalerweise werden die Dokumente dann per Datum differenziert, so auch die Philosophie der Umbenennung.
Ist ein Dokument dennoch mal gleich benannt, wird es per Zähler gekennzeichnet.

Wenn Du komplexere Umbenennungen haben möchtest, kommst Du um die Verwendung ein YAML-Datei nicht umhin.
Gruß
Karsten
 
  • Like
Reaktionen: geimist
Hello.
Does anyone know a free android application with which I can take photos of receipts and save them in specific directories in the android phone? And those directories will be synchronized with directories on my nas where synocr will process those pdf and renamed them .
If you know a tested solution for this.
Thank you.
 
Hallo in die Runde,

ich habe auf die aktuelle Version geupdated. Seitdem habe ich das Problem, dass nachdem die synOCR lief und die Datei erfolgreich Eingelesen und bearbeitet hat ich eine Meldung bekomme, dass der Container SynOCR unerwartet beendet wurde. Hat evtl. jemand Hinweise, woran es liegen könnte und wie ich die Meldung deaktiviert bekomme?
Danke euch!
 
Hallo zusammen, ich muss noch mal auf eine Problematik mit dirname_RegEx zurückkommen. Ich habe die Regel wie folgt definiert:

1757807462201.png

Ich bekomme hier das Jahr und den Monat aus dem Dokument - das klappt bei tagname auch wunderbar.
Gebe ich aber §dirname_RegEx unter targetfolder mit an, werden Fehler-Ordner erstellt:

1757807611186.png

Hat jemand eine Idee, woran das liegen kann?

Nutze synOCR erst seit ein paar Stunden und habe mit RegEx auch noch nie zutun gehabt und mich gefreut, dass so viele Regeln doch funktionieren. Da will ich nicht, dass es daran scheitert ;)

Danke Euch vorab für eine vielleicht etwas anfängerfreundliche Hilfestellung - KI dreht sich im Kreis :(
 
  • Like
Reaktionen: Struppix und kshb
Hallo an alle,

gibt es eine Möglichkeit, die Größe der auszugebenden PDF-Datei auf eine feste Größe, z. B. auf A4, zu bestimmen? So sollen die auszugebenden Dateien eine definierte Größe bekommen unabhängig davon, in welcher Größe der Original-Scan ist. Danke für eure Ideen und Hinweise.
 
Nein, da gibt es meines Wissens keinen Schalter für OCRmyPDF. Da die nötigen Tools aber bereits durch synOCR installiert sind, kannst mit einem kleinen Hilfskript deine Dateien konvertieren. Dazu müsstest du halt in einen vorgelagerten Ordner scannen und daraus deine Dateien mit dem Skript in den synOCR-Inputordner verarbeiten.

(Das Skript war jetzt nur ein schneller Versuch und bei mir einen Kassenbon wie gewünscht auf A4 skaliert.)

Bash:
konvertierskript="/volumeX/path/pdf2a4.py"
quelldatei="/volumeX/path/input.pdf"
zieldatei="/volumeX/path/output.pdf"

source /usr/syno/synoman/webman/3rdparty/synOCR/python3_env/bin/activate # nutze die installierten Module
python3 "$konvertierskript" "$quelldatei" "$zieldatei"
deactivate

Python:
import sys
import fitz  # PyMuPDF

# A4 in Punkten (1pt = 1/72 inch)
A4_WIDTH = 595.276  # 210 mm
A4_HEIGHT = 841.890 # 297 mm

def normalize_to_a4(input_file, output_file):
    doc = fitz.open(input_file)
    new_doc = fitz.open()

    for page in doc:
        rect = page.rect
        scale_x = A4_WIDTH / rect.width
        scale_y = A4_HEIGHT / rect.height
        scale = min(scale_x, scale_y)  # proportional skalieren

        # Neue A4-Seite
        new_page = new_doc.new_page(width=A4_WIDTH, height=A4_HEIGHT)

        # Skalierungsmatrix
        matrix = fitz.Matrix(scale, scale)

        # Offsets (in Zielkoordinaten)
        x_offset = (A4_WIDTH - rect.width * scale) / 2
        y_offset = (A4_HEIGHT - rect.height * scale) / 2

        # Translation-Matrix erzeugen und mit Skalierung kombinieren
        translate = fitz.Matrix(1, 0, 0, 1, x_offset, y_offset)
        matrix = matrix * translate  # erst skalieren, dann verschieben

        new_page.show_pdf_page(new_page.rect, doc, page.number, matrix=matrix)

    new_doc.save(output_file)
    new_doc.close()
    doc.close()


if __name__ == "__main__":
    if len(sys.argv) != 3:
        print("Usage: python pdf2a4.py input.pdf output.pdf")
        sys.exit(1)

    input_file = sys.argv[1]
    output_file = sys.argv[2]
    normalize_to_a4(input_file, output_file)
 

Anhänge

Zuletzt bearbeitet:
  • Like
Reaktionen: Struppix
Moin zusammen,
Spannend das es bereits 246 pages zu dem Thema synOCR gibt und wie man das meiste aus dem Tool heraus kitzeln kann. Ich habe es leider bisher noch überhaupt nicht ans Laufen gekriegt. x-mal de-/installiert, sämtliche Tutorials geschaut und langsam bin ich mit dem Latein am Ende. Pfade sind alle korrekt.
Sobald ich ein Profil aktiviere, wird die blaue Sanduhr angezeigt und bei Ausführung ein Haufen Fehler in das Log-file geschrieben.

ERROR at line 2881: prepare_python_log=$(prepare_python)
ERROR at line 1310: tmp_log1=$(python3 -m pip install "${module}")
ERROR at line 1310: python3 -m pip install "${module}"
ERROR at line 2881: return 1
ERROR at line 2397: pageCount=$( py_page_count "${outputtmp}" )

Von den Tag-Errors ganz zu schweigen ..

@geimist: wärest du so nett und würdest dir das Logfile einmal zu Herzen nehmen?

DS725+ // AMD R1600 // 2.6GHz // RAM 4096MB
 
Zunächst ein herzliches Willkommen hier im Forum :)
@geimist: wärest du so nett und würdest dir das Logfile einmal zu Herzen nehmen?
Es guck mir das gern an. Eigentlich sind die x86_64 Geräte ziemlich entspannt in ihrer Kompatibilität. Auf einigen DS925er läuft es auch augenscheinlich.
Bitte lass mir doch das gesamte Log mal zukommen. Bei dir scheint es bereit beim Erstellen der virtuellen Pythonumgebung zu klemmen (1x nach einer Installation erforderlich).
 
  • Like
Reaktionen: LAR_Hamburg
Hallo @LAR_Hamburg,
bitte installiere mal DIESE Version und gib mir bitte Feedback. Wenn es läuft, aktualisiere ich das Paket für alle.

Offensichtlich gab es durch externe Updates von Pythonmodulen eine Inkompatibilität. Dein Fehler hat ziemlich sicher jede Neuinstallation betroffen.
 

Additional post fields

 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat