synOCR synOCR - GUI für OCRmyPDF

BogusBogey

Benutzer
Mitglied seit
12. Jul 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
0
Hallo Stephan,

Vielen Dank für Ihre schnelle Antwort.
Der Grund dafür ist, dass der Entwickler auf seinem Docker-Hub Folgendes angibt:
"DEPRECATED - use jbarlow83/ocrmypdf-alpine instead - no longer updated"

Gruß, Erwin
 
Zuletzt bearbeitet von einem Moderator:

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Vielen Dank, das hatte ich noch gar nicht gesehen. Es scheint ja für unseren Fall nur das "ocrmypdf-polyglot"-Image zu betreffen. Derzeit ist das Alpine-Image sogar noch eine Minorversion älter und das Polyglot-Image sollte ja vorerst auch weiter problemlos funktionieren.

Ich werde mir mal ansehen, ob das Alpine-Image vergleichbar funktioniert um es in Zukunft zu ersetzen.
 

linuxdep

Benutzer
Mitglied seit
02. Jan 2009
Beiträge
584
Punkte für Reaktionen
11
Punkte
38
liest sich gut... tolles Projekt.

Wie verarbeitet ihr eure Dokumente weiter, vor allem suchen danach?
habe immer noch keine richtige Lösung für meine Dokumente gefunden. Soll halt einfach nutzbar sein und auch wenn ich vom Bus überfahren werde, von wem anderst (Frau & Kinder) zugegriffen werden können. Da war mir ecoDMS etwas zu weit ausgeholt, Dateien im Share Ordner bekommt Frau sicher schon noch hin.

Da wäre ein zugriff vom Handy/Tablet schon ganz nett. Nutzt da schon wer was in der Richtung?
 

Synchrotron

Benutzer
Sehr erfahren
Mitglied seit
13. Jul 2019
Beiträge
4.658
Punkte für Reaktionen
1.643
Punkte
214
Probier es mal mit Evernote.

BASIC zum testen ist kostenlos, bis zu 2 Geräte + WebClient, plus Upload 50MB/Monat.

Premium kostet, hat dann aber 10GB Upload/Monat und eine volle Suchfunktion in pdfs. Schon geOCRte pdfs werden so für den Index genutzt, nicht OCRte werden auf dem EN-Server OCRed, ebenso z.B. hochgeladenen Bilder.

Nutze EN selbst und bin sehr zufrieden, insbesondere mit dem absolut stabilen Sync über alle meine Geräte.
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Ich synce den Zielordner mit meinem Mac wo ich einfach die Volltextsuche über Spotlight verwende. Auch "Universal Search" auf er DS sollte eine Alternative sein.
 

mördock

Benutzer
Mitglied seit
04. Jan 2012
Beiträge
796
Punkte für Reaktionen
15
Punkte
44
Ich meide alle Methoden die mich an Softwareprodukte binden, Datenbanken sind solange gut wie es das Programm gibt welches die Datenbank auswerten kann. EcoDMS, Evernote und Co. haben natürlich eine Daseinsberechtigung, aber genau wie linuxdep bin ich darum bemüht meine Dokumente so abzulegen das auch "fremde" sich zurechtfinden können wenn es mal hart auf hart kommt.
Ich habe meine Dokumente einfach auf der DS in einem shareordner liegen
Beispiel:
Unterlagen > Versicherungen > Versicherungsnummer > Datum-Inhaltsstichwort.pdf
oder
Unterlagen > Banken > Zinswucherbank > Kontonummer > Schriftverkehr > Datum-Inhaltsstichwort.pdf
Das Datum habe im Dateinamen habe ich kürzlich auf das Format JJJJ-MM-TT umgestellt, so sind die Dokumente chronologisch sortiert.
Was wenn ich mal wirklich weg bin? Wie findet jemand die Dokumente?
Es gibt eine Keepass Datei deren Kennwort zwei Vertrauenspersonen bekannt ist, In dieser Datei ist u.a. auch eine Anleitung enthalten welche beschreibt wie man wo meine Daten und deren Backup findet.
Die Keepassdatei ist nicht nur auf der DS gespeichert, denn was ist wenn niemand auf die Idee kommt dort zu suchen oder die DS mit mir zusammen in die Luft fliegt?

Die Suche in Dokumenten erledigt entweder Universalsearch oder einfach die Windowssuche, da in jedem Dateinamen ein Stichwort ist finde ich immer alles sehr schnell und zuverlässig.

#Mördock#
 

Synchrotron

Benutzer
Sehr erfahren
Mitglied seit
13. Jul 2019
Beiträge
4.658
Punkte für Reaktionen
1.643
Punkte
214
Man sollte wissen, worüber man redet:

Bei EN liegt die Masterdatenbank auf einem Cloudserver. Bei den beiden Desktopclients liegt immer eine lokale Kopie der Datenbank auf der eigenen Festplatte. Die kann man z.B. auf die Syno backuppen (läuft bei mir als täglicher Job) und nur mit Mitteln des Clients als .enex-File exportieren. Verschiedene Dienste bieten den Datenimport aus EN, so z.B. OneNote oder Notion. Kein lock-in in eine proprietäre SW und ein proprietäres Datenformat. Das wäre für mich ein klares k.o.-Kriterium gewesen.

Über die Cloud läuft der Sync zwischen den Clients, und die mobilen Clients ziehen sich die Informationen vom Server.

Wir brauchen da keinen Glaubenskrieg führen. Im Zweifel reichen auch 1-2 gut geführte und gefüllte Leitzordner im Regal, mit den nötigen Vollmachten und Dokumenten, um für das eigene Ableben Vorsorge zu treffen.

Persönlich nutze ich EN, weil es MIR hilft, meine Unterlagen sortiert und parat zu haben.
 

Matthieu

Benutzer
Mitglied seit
03. Nov 2008
Beiträge
13.222
Punkte für Reaktionen
88
Punkte
344
Zum in Dokumenten suchen fallen mir noch zwei Dinge ein:
- Universal Search direkt auf der DS - sucht auch in PDFs
- der Adobe iFilter zur lokalen Nutzung im Windows macht PDFs mit der Standardsuche durchsuchbar auf Ordnerebene

MfG Matthieu
 

ebusynsyn

Benutzer
Mitglied seit
01. Jun 2015
Beiträge
346
Punkte für Reaktionen
173
Punkte
99
Hallo

Die folgenden Geräte sind bei mir für das papierlose Büro im Einsatz:

- iPhone mit ScannerPro
- iPad mit Documents 6 (seit rund 7 Monaten im Einsatz und Ersatz für das MacBookPro von 2016)
- Scanner (Brother ADS-1600)
- Synology NAS DS918+ i (SynOCR)

Der Ablauf ist wie folgt:
Gescannt wird entweder via iPhone oder Scanner. Dann automatischer Upload in den Eingangsordner von SynOCR im NAS. Danach wieder automatisch ins entsprechende Jahr des Archives (NAS). Das Jahr hat keine weitere Unterteilung. Pro Jahr fallen etwa 200 Dokumente an.

Mit der App Documents 6 finde ich jedes Dokument in wenigen Sekunden mit ein zwei Stichworten, da diese App die Textsuche im Dokument perfekt unterstützt.

Schon vor der Nutzung des iPad hatte ich im entsprechenden Jahr keine weitere Unterteilung. Das ist alte Schule und schlicht unnötig. Das Papierdokument wird dann in einer A4-Box (nicht Ordner) hinein gelegt. Das älteste ist somit immer zu unterst.

Wenn das neue Jahr beginnt, wird das Alte gebündelt und im Keller versenkt. So ein Bündel braucht wenig Platz, und sollte es dennoch mal nötig sein, hat man die Dokumente noch. Seit 2011 mache ich es in etwa so, wobei die Geräte und Apps natürlich immer mal wieder ersetzt wurden.

Auch ich will mich nicht an eine Software/Hersteller wie EcoDMS oder so binden. Ein durchsuchbares PDF scheint mir längerfristig die Beste Lösung zu sein.

Gruss, Erich
 
Zuletzt bearbeitet:

Tobyyy

Benutzer
Mitglied seit
01. Aug 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
HI zusammen,

auf diesem Wege nochmals vielen vielen Dank an geimist für die mega Arbeit! Ich hab nun jedoch ein anderes Problem: dadurch, dass im Package Center der DS216j der Docker nicht kompatibel ist, kann ich die erforderlichen Container nicht leider. Könntet ihr mir bitte einen Tip geben, wie ich den ocrmypdf-Container trotzdem geladen bekommen, sodass synocr läuft?`

Vielen Dank vorab für die Hilfe!
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Hallo Tobyyy,

herzlich willkommen hier im Forum :)

synOCR ist ja in erster Linie eine GUI für den Dockercontainer ocrmypdf. Selbst wenn es dir gelänge, ocrmypdf für deine ARM-CPU-Architektur zu kompilieren und es auf deiner DS laufen zu lassen, müsste man synOCR noch entsprechend umbauen.
Schlussendlich: es läuft nur auf einer DS mit 64bit Intel-CPU (das sollte auch z.B. mit einer älteren DS713+ funktionieren).
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
… Mit der App Documents 6 finde ich jedes Dokument in wenigen Sekunden mit ein zwei Stichworten, da diese App die Textsuche im Dokument perfekt unterstützt. …

Hallo Erich,

wie suchst du in Dcouments?
Hast du den Ordner mit den PDFs zwischen DS und App synchronisiert oder suchst du remote auf der DS (wo ich nämlich nicht wüsste, wie es ginge)?
 

ebusynsyn

Benutzer
Mitglied seit
01. Jun 2015
Beiträge
346
Punkte für Reaktionen
173
Punkte
99
Hallo Stephan

Ja, in der Tat funktioniert es nur, wenn der Ordner zwischen DS und App synchronisiert wird. Das benötigt zu Beginn Zeit für die Synchronisation und dann nochmals für die Indizierung. Später, wenn dann nur noch einzelne Dokumente synchronisiert/indiziert werden, läufts es recht schnell.

Mit Gruss - Erich
 
Zuletzt bearbeitet von einem Moderator:

Elfenhorstm

Benutzer
Mitglied seit
23. Mai 2017
Beiträge
4
Punkte für Reaktionen
0
Punkte
0
Hi Synos

Wow das ding ist der Hammer. Wenn ich darf würde ich gerne noch ein paar Features requesten ;-)

1. Subfolders im Input Ordner und Replikation der Ordnerstrucktur im Output Ordner. Das würde einige der Fragen nach zwei Input Ordnern abdecken.
2. Alle erfolgreich bearbeiteten Dateien werden Umbenannt zu "Dateiname_OCRd" oder sowas. Die Output Datei bekommt den Namen der alten. Das ganze im gleichen Verzeichnis. Das ist perfekt wenn man eine Zeitschriften Sammlung in Unterordnern ( z.B. in einer Calibre Datenbank ) hat und die alle Bearbeiten will. Nach Ueberpruefung kann man einfach nach _OCRd suchen und alle löschen.

Ich danke dir vielmals für die Arbeit die du hier reingesteckt hast.

Gruss

Matze
 

Tobyyy

Benutzer
Mitglied seit
01. Aug 2019
Beiträge
2
Punkte für Reaktionen
0
Punkte
1
Hallo geimist,

okidok. Vielen lieben Dank für die schnelle Antwort. Dann wird es wohl ein Umstieg auf die 218+ oder so demnächst. :)

LG
Toby
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Hallo Matze,

... Wenn ich darf würde ich gerne noch ein paar Features requesten ;-) …
Kannst du immer, aber zur Zeit kann ich micht nicht auf die Entwicklung von synOCR konzentrieren. Irgendwann geht's weiter. Ausreichend Ideen gibts ja bereits :D

... 1. Subfolders im Input Ordner und Replikation der Ordnerstrucktur im Output Ordner. Das würde einige der Fragen nach zwei Input Ordnern abdecken …
Mit Subfoldern wollte ich in Zukunft das Konvertieren und Mergen von Bilddateien realisieren. Ob das so kommen wird, weiß ich noch nicht. Für unterschiedliche Inputordner gibt es ja inzwischen die Profile. Ich gehe bei synOCR eigentlich von einem automatischen Workflow aus, weshalb eigentlich ein einzelner Inputordner (je Profil) ausreichend sein sollte.

... 2. Alle erfolgreich bearbeiteten Dateien werden Umbenannt zu "Dateiname_OCRd" oder sowas. Die Output Datei bekommt den Namen der alten. Das ganze im gleichen Verzeichnis. Das ist perfekt wenn man eine Zeitschriften Sammlung in Unterordnern ( z.B. in einer Calibre Datenbank ) hat und die alle Bearbeiten will. Nach Ueberpruefung kann man einfach nach _OCRd suchen und alle löschen.
Wenn ich dich richtig verstanden habe, kannst du das doch bereits?
  • die "OCR Rename-Syntax" setzt du auf "§tit_OCRd"
  • "im Zielordner behalten" auswählen
In Kombination mit einem extra Profil kannst du ja auch einen Unterordner des bisherigen Inputordners und dasselbe für den Outputordner konfigurieren. Auf die Art sollte sich deine Config abbilden lassen.
 

Elfenhorstm

Benutzer
Mitglied seit
23. Mai 2017
Beiträge
4
Punkte für Reaktionen
0
Punkte
0
Hi Stephan

Mit Subfoldern wollte ich in Zukunft das Konvertieren und Mergen von Bilddateien realisieren. Ob das so kommen wird, weiß ich noch nicht. Für unterschiedliche Inputordner gibt es ja inzwischen die Profile. Ich gehe bei synOCR eigentlich von einem automatischen Workflow aus, weshalb eigentlich ein einzelner Inputordner (je Profil) ausreichend sein sollte.

Ich möchte gerne einen Verzeichnisbaum als quelle angeben und drei Wochen später sind alle Dateien in allen Unterordnern bearbeitet ;-)

Wenn ich dich richtig verstanden habe, kannst du das doch bereits?
die "OCR Rename-Syntax" setzt du auf "§tit_OCRd"
"im Zielordner behalten" auswählen

Soweit ich das verstanden habe benennt OCR Rename-Syntax die neue ( bearbeitete ) Datei um und nicht die Originale oder?

Ich möchte ja gerade die Original Datei umbenennen und die neue an die gleiche Stelle ( vorzugsweise in Unterordnern ;)) ablegen. Somit wird in meiner Calibre Datenbank als Beispiel von nun an die Neue durchsuchbare angezeigt ohne das ich neu indizieren muss.

Ich versuche es gleich nochmal. Kommt schon mal vor das ich was verpeile.

Ich danke dir für deine Zeit.

Gruss

Matze
 

geimist

Benutzer
Sehr erfahren
Maintainer
Mitglied seit
04. Jan 2012
Beiträge
5.371
Punkte für Reaktionen
1.188
Punkte
234
Achso, der Input-Ordner soll rekursiv abgearbeitet werden und die Dateibaumstruktur erhalten bleiben. Sorry, dem ist nicht so - da habe ich dich falsch verstanden. Und Quelldateien lassen sich in der Tat (noch) nicht umbenennen. Ich schreibe mir deinen Wunsch aber mit auf.
 

dblumx

Benutzer
Mitglied seit
03. Aug 2019
Beiträge
6
Punkte für Reaktionen
0
Punkte
0
Bildschirmfoto 2019-08-03 um 08.16.07.jpg

Hallo, ich habe eine relativ neue Synology DSM, die DS218 mit 4 Core 1,4 GHz und 2048 MB RAM gekauft und wollte synOCR installieren, erhalte aber folgende Meldung. Bin völliger Neuling bei der DSM, was muss ich machen?
 

reiki

Benutzer
Mitglied seit
16. Mai 2012
Beiträge
349
Punkte für Reaktionen
5
Punkte
18
Dein NAS-Modell hat keinen Intel-Prozessor verbaut, sondern den Realtek RTD1296 (Quad-Core 1,4 GHz) vom Typ ARM-Cortex-A53. Damit sind leider einige neuere Anwendungen/Pakete nicht installierbar.
 


 

Kaffeautomat

Wenn du das Forum hilfreich findest oder uns unterstützen möchtest, dann gib uns doch einfach einen Kaffee aus.

Als Dankeschön schalten wir deinen Account werbefrei.

:coffee:

Hier gehts zum Kaffeeautomat