Hallo Henning,
willkommen in unserem Forum. Sorry, dass ich so spät antworte. Aber ich bin länger auf Arbeit als zuhause, und das schon eine langer Zeit.
Leider kann ich hier im Forum nicht mehr editieren, sodass die Beiträge oft nicht auf dem neuesten Stand sind.
Wenn das mal ein Admin ließt, wäre toll, wenn man das einrichten könnte.
Nun das mit dem Multiline funktioniert schon, nur nicht mit der RegEx zur und dem Ausschluss der eigenen Adresse. Wohlgemerkt für alle Leser, nur auf der Synology nicht.
Aber mit einem kleinen Kniff kann man das umgehen und letztlich doch zum Ziel kommen..
Bitte nicht vergessen die YAML umzubenennen, Deinen Targetfolder und Deine Namen einzutragen / zu ändern.
Bitte poste mal ob es klappt, und wie hoch die Trefferquote ist:
Falls Fragen sind oder Du Probleme hast einfach melden.
Karsten
willkommen in unserem Forum. Sorry, dass ich so spät antworte. Aber ich bin länger auf Arbeit als zuhause, und das schon eine langer Zeit.
Leider kann ich hier im Forum nicht mehr editieren, sodass die Beiträge oft nicht auf dem neuesten Stand sind.
Wenn das mal ein Admin ließt, wäre toll, wenn man das einrichten könnte.
Nun das mit dem Multiline funktioniert schon, nur nicht mit der RegEx zur und dem Ausschluss der eigenen Adresse. Wohlgemerkt für alle Leser, nur auf der Synology nicht.
Aber mit einem kleinen Kniff kann man das umgehen und letztlich doch zum Ziel kommen..
Bitte nicht vergessen die YAML umzubenennen, Deinen Targetfolder und Deine Namen einzutragen / zu ändern.
Bitte poste mal ob es klappt, und wie hoch die Trefferquote ist:
Falls Fragen sind oder Du Probleme hast einfach melden.
Karsten
YAML:
# synOCR_YAMLRULEFILE # keep this line!
rule_1001:
tagname: §tagname_RegEx_Vorname1_Nachname
targetfolder: /volume1/save/dokumente/Eigene Dateien/Rechnungen
tagname_RegEx: (?i)(Rechnung|Invoice|Lieferschein|delivery note|Quittung|receipt|Bestellung|Online-Bestellung|Online-Auftrag|order|Barkauf|Barverkauf|cash purchase|Kundenbeleg|Verkauf|sale|Einkauf|purchasing|Kasse|cash desk|BON)
postscript: mv "${output}" "${output%/*}/$(echo "${output##*/}" | sed -e 's/ /_/g')"
condition: all
subrules:
- searchstring: (?i)(Rechnung|Invoice|Lieferschein|delivery note|Quittung|receipt|Bestellung|Online-Bestellung|Online-Auftrag|order|Barkauf|Barverkauf|cash purchase|Kundenbeleg|Verkauf|sale|Einkauf|purchasing|Kasse|cash desk|BON)
searchtyp: contains
isRegEx: true
- searchstring: Vorname1
searchtyp: contains
rule_1002:
tagname: §tagname_RegEx_Vorname2_Nachname
targetfolder: /volume1/save/dokumente/Eigene Dateien/Rechnungen
tagname_RegEx: (?i)(Rechnung|Invoice|Lieferschein|delivery note|Quittung|receipt|Bestellung|Online-Bestellung|Online-Auftrag|order|Barkauf|Barverkauf|cash purchase|Kundenbeleg|Verkauf|sale|Einkauf|purchasing|Kasse|cash desk|BON)
postscript: mv "${output}" "${output%/*}/$(echo "${output##*/}" | sed -e 's/ /_/g')"
condition: all
subrules:
- searchstring: (?i)(Rechnung|Invoice|Lieferschein|delivery note|Quittung|receipt|Bestellung|Online-Bestellung|Online-Auftrag|order|Barkauf|Barverkauf|cash purchase|Kundenbeleg|Verkauf|sale|Einkauf|purchasing|Kasse|cash desk|BON)
searchtyp: contains
isRegEx: true
- searchstring: Vorname2
searchtyp: contains
rule_1003:
tagname: §tagname_RegEx
tagname_RegEx: (?i)(?>(([a-z0-9\-\p{L}]+?[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z0-9\-\p{L}]+?[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z0-9\-\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z0-9\-\p{L}]+)))\b\N*?\b(?=\W{1,}[a-z\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,2}[a-z0-9\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,2}[a-z\p{L}]+[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{1,3}\d{0,4}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}\d{0,4}[a-z\p{L}]{0,2}\b\R*\b[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z\p{L}]{0,2}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}\d{5}[\.\,\-\:\;\•\|\&\/*\!\ ]{0,3}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z\p{L}]+)
condition: all
subrules:
- searchstring: (GmbH|mbH|GbR|\sAG\s|\sKG\s|OHG|e.K.|Meister(betrieb)*)
searchtyp: is not
isRegEx: true
- searchstring: (?>(([a-z0-9\-\p{L}]+?[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z0-9\-\p{L}]+?[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z0-9\-\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z0-9\-\p{L}]+)))\b\N*?\b(?=\W{1,}[a-z\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,2}[a-z0-9\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,2}[a-z\p{L}]+[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{1,3}\d{0,4}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}\d{0,4}[a-z\p{L}]{0,2}\b\R*\b[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z\p{L}]{0,2}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}\d{5}[\.\,\-\:\;\•\|\&\/*\!\ ]{0,3}[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z\p{L}]*[\.\,\-\:\;\•\|\&\/*\!\(\)\ ]{0,3}[a-z\p{L}]+)
searchtyp: contains
isRegEx: true
multilineregex: true
- searchstring: Vorname1
searchtyp: is not
- searchstring: Vorname2
searchtyp: is not
rule_1004:
tagname: §tagname_RegEx
tagname_RegEx: (?i)(.+(GmbH|mbH|GbR|\sAG\s|\sKG\s|OHG|e.K.|Meister(betrieb)*))
condition: all
subrules:
- searchstring: (GmbH|mbH|GbR|\sAG\s|\sKG\s|OHG|e.K.|Meister(betrieb)*)
searchtyp: contains
isRegEx: true
rule_1005:
tagname: §tagname_RegEx
tagname_RegEx: (?i)\b(?:[a-z\p{L}]+[\.\-\:\;\!\(\)\[\]\ ]+[a-z0-9\p{L}\!]+)([\.\-\:\;\!\(\)\[\]\ ]*[a-z0-9\p{L}]*[\.\-\:\;\!\(\)\[\]\ ]*[a-z0-9\p{L}]*)\b(?=.*\s\d{1,3}[\,\.]\d{2,4}[^\.](\p{Sc}|EUR){0,1})
condition: all
subrules:
- searchstring: \b(?:[a-z\p{L}]+[\.\-\:\;\!\(\)\[\]\ ]+[a-z0-9\p{L}\!]+)([\.\-\:\;\!\(\)\[\]\ ]*[a-z0-9\p{L}]*[\.\-\:\;\!\(\)\[\]\ ]*[a-z0-9\p{L}]*)\b(?=.*\s\d{1,3}[\,\.]\d{2,4}[^\.](\p{Sc}|EUR){0,1})
searchtyp: contains
isRegEx: true
rule_1006:
tagname: §tagname_RegEx
tagname_RegEx: (?i)(?=(Bezeichnung|Benennung|Designation|Beschreibung|Description|\bArtikel[^:]|Article[^:]\b))(.+?\R{1,3}?).+?(\W+\S*\s*\d{5,}?\s*)\K(?:[a-z\p{L}]+[\.\-\:\;\! ]*[a-z\p{L}\\\!]*[\.\-\:\;\! ]*[a-z0-9\p{L}]*[\.\-\:\;\! ]*[a-z0-9\p{L}]*)
multilineregex: true
condition: all
subrules:
- searchstring: \b(?:[a-z\p{L}]+[\.\-\:\;\!\(\)\[\]\ ]+[a-z0-9\p{L}\!]+)([\.\-\:\;\!\(\)\[\]\ ]*[a-z0-9\p{L}]*[\.\-\:\;\!\(\)\[\]\ ]*[a-z0-9\p{L}]*)\b(?=.*\s\d{1,3}[\,\.]\d{2,4}[^\.](\p{Sc}|EUR){0,1})
searchtyp: does not contain
isRegEx: true
- searchstring: (?=(Bezeichnung|Benennung|Designation|Beschreibung|Description|\bArtikel[^:]|Article[^:]\b))(.+?\R{1,3}?).+?(\W+\S*\s*\d{5,}?\s*)\K(?:[a-z\p{L}]+[\.\-\:\;\! ]*[a-z\p{L}\\\!]*[\.\-\:\;\! ]*[a-z0-9\p{L}]*[\.\-\:\;\! ]*[a-z0-9\p{L}]*)
searchtyp: contains
isRegEx: true
multilineregex: true
rule_1007:
tagname: Rechnungsnummer_§tagname_RegEx
tagname_RegEx: (?i)(?|(((Rechnung\S{0,2})|(Beleg\S{0,2})|(Lieferschein\S{0,2}))\s*(([N|n]um\S*|Nr[\.\-\:\;\/\|\s]{0,3})|(RE[\.\-\:\;\/\|\s]NR)\S*)*)\s+?\K(\S*\s*?(\s*\d)+))+\b
condition: all
subrules:
- searchstring: (?|(((Rechnung\S{0,2})|(Beleg\S{0,2})|(Lieferschein\S{0,2}))\s*(([N|n]um\S*|Nr[\.\-\:\;\/\|\s]{0,3})|(RE[\.\-\:\;\/\|\s]NR)\S*)*)\s+?\K(\S*\s*?(\s*\d)+))+\b
searchtyp: contains
isRegEx: true




