synOCR ist eine einfache GUI für den Dockercontainer OCRmyPDF auf Synology Diskstation.
Die Downloadseite findest du hier: https://geimist.eu/synOCR/
Hilfe und Diskussion hier im Forum: https://geimist.eu/link/synocrforum
https://geimist.eu/synOCR/
Die Downloadseite findest du hier: https://geimist.eu/synOCR/
Hilfe und Diskussion hier im Forum: https://geimist.eu/link/synocrforum
https://geimist.eu/synOCR/
You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
215 lines
10 KiB
215 lines
10 KiB
Release Notes |
|
|
|
! ! ! ATTENTION ! ! ! |
|
This version only supports DSM6.x |
|
DSM7 version you can found here: https://git.geimist.eu/geimist/synOCR/src/branch/master/PKG_DSM7/CHANGELOG |
|
|
|
1.3.0 [2022-xx-xx] |
|
BUGFIXES: |
|
- counting of log and backup files to be deleted was not correct under certain situations |
|
- catching an error message if there are no docker images to be cleaned up |
|
IMPROVEMENT: |
|
- YAML rules: if the value for condition not set - fallback to any |
|
IMPLEMENTATIONS: |
|
- 🔥 Input folder monitoring included (need installed inotify-tools from here: https://synocommunity.com/package/inotify-tools) |
|
to use this: call synOCR-start.sh with parameter start in DSM task scheduler: |
|
/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh start |
|
a pulsing status icon in the gui indicates an active monitoring |
|
- 🔥 new Python based date search implemented, which also finds written out months (gthorsten) |
|
- 🔥 support separator sheet - dokument split pattern can be configured in GUI (Python3 must be installed) |
|
- 🔥 Pictures in the source folder can be converted automatically (Python3 must be installed) |
|
- option to reduce multiple spaces to one (helpful with RegEx) |
|
- the number of pages is now determined with Python - Exiftool and pdfinfo become obsolete (Python3 must be installed) |
|
- Metadata will be add with Python - Exiftool become obsolete (Python3 must be installed) |
|
- set author (get author information from ocr options if set [--author john doe]) |
|
- set creation date (depending on which one was defined: OCR, file date, now) |
|
- set keywords |
|
- the conversion from YAML to JSON is no longer done with the binary yq but by Python (Python3 must be installed) |
|
- logging deleted backup files in loglevel 2 |
|
- [GUI] notify about updates in main page (because cphub.net is not working) |
|
- [GUI] support for french language (machine translated) |
|
|
|
1.2.0 [2022-01-11] |
|
IMPORTANT: |
|
- with this version the scheduler is no longer available in the GUI. |
|
Please use the DSM task scheduler! |
|
BUGFIXES: |
|
- RegEx with lookahead / lookbehind for tag names were not possible |
|
- minor bugfixes (thx to tommes) |
|
IMPROVEMENT: |
|
- handling of special characters improved |
|
- cleanup of unused docker images |
|
- DSM notifications: list all possible users |
|
- indicator about valid directorys in GUI |
|
- the order of the tags can now be defined |
|
criterion is the alphabetical sorting of the rule names in the YAML file |
|
- rewrite GUI (thx to tommes) |
|
IMPLEMENTATIONS: |
|
- renaming parameter for the year can now be 2 or 4 digits |
|
(§yocr2 §yocr4 §ynow2 §ynow4 §ysource2 §ysource4) |
|
- added renaming parameter §pagecount (pages of current document) |
|
- all renaming parameter can be used as path components in YAML-rules (except document title [§tit]) |
|
- target files can moved to folders named by year |
|
- target files can moved to folders named by year/month |
|
- number of backup files can now be limited (days or number) |
|
|
|
1.1.2 [2021-04-21] |
|
BUGFIXES: |
|
- an error when the page counter could not be calculated. |
|
IMPROVEMENT: |
|
- counter for processed pages at aarch64 are now possible if Exiftool is installed |
|
|
|
1.1.1 [2021-04-05] |
|
BUGFIXES: |
|
- fixed century check |
|
- fixed name of variable |
|
|
|
1.1.0 [2021-03-31] |
|
IMPLEMENTATIONS: |
|
- added the option to define the tag name via RegEx (Parameter tagname_RegEx in YAML file) |
|
- added a counter for processed pages and files per profile (x86_64 only) |
|
- added additional renaming parameters: |
|
§hhsource §mmsource §sssource §hhnow §mmnow §ssnow §pagecounttotal §filecounttotal §pagecountprofile §filecountprofile |
|
- support for CPU aarch64 (statistics work only limited, because pdfinfo is missing). |
|
- improved date search / data to be ignored can be specified in the GUI (thanks to DeeKay1) |
|
BUGFIXES: |
|
- tagsymbol with spaces don't work |
|
- copy file, if hard links are not createable |
|
- it is no longer calculated with expr |
|
- 'force quiet' (GUI) now also terminates the Docker container synOCR |
|
- minor bugfixes |
|
|
|
1.0.2 [2020-08-22] |
|
BUGFIXES: |
|
- file date could not be set to source |
|
- if no destination folder was defined in all fulfilled rules (YAML file), the destination file was lost |
|
- file permission of the target file adjusted (664 and ACL-inheritance) |
|
|
|
1.0.1 [2020-07-22] |
|
BUGFIXES: |
|
- >condition: all< was not evaluated correctly (YAML-file) |
|
- unnecessary counter supplement of the target file, if no renaming syntax was specified |
|
- YAML-Samplefile was not created correctly if there were spaces in the path |
|
- file permission of the target file adjusted |
|
|
|
1.0.0 [2020-07-13] |
|
IMPLEMENTATIONS: |
|
- multilingual GUI (currently German, English) |
|
- advanced rule management (in combination with an external YAML-file -> write Samplefile with button in GUI) |
|
- tags are now independent of the search term (alias - in combination with an external YAML-file) |
|
- source files: a search prefix with preceding "!" inverts the search in filename ( !value ) |
|
- source files: a final "$" is used as search suffix in filename ( value$ ) |
|
- if the Exiftool is installed, found tags and date are written into the meta data |
|
BUGFIXES: |
|
- if a path refers to an (unmounted) encrypted directory, the program run is aborted |
|
|
|
0.17.1 [2020-06-18] |
|
BUGFIXES: |
|
- Fehler, wenn keine Umbenennungssyntax angegeben wurde |
|
|
|
0.17.0 [2020-05-10] |
|
IMPLEMENTIERUNGEN: |
|
- Tags können über ein externes Textfile geladen werden |
|
- Dockerimages mit :latest-Tag können automatisch aktualisiert werden |
|
|
|
0.16.3 [2020-03-02] |
|
BUGFIXES: |
|
- Problem beim Einsortieren in Tagordner |
|
|
|
0.16.2 [2020-02-18] |
|
BUGFIXES: |
|
- Korrektur der Datumserkennung |
|
|
|
0.16.1 [2020-02-09] |
|
BUGFIXES: |
|
- Sonderzeichen in tags führte zu fehlerhafter Umbenennung |
|
|
|
0.16.0 [2020-01-28] |
|
IMPLEMENTIERUNGEN: |
|
- es steht wieder ein aktuelles "polyglot-Image" mit allen Sprachen zur Auswahl |
|
- manuell heruntergeladene Images stehen ebenfalls zur Auswahl (sofern "ocrmypdf" im Namen enthalten ist) |
|
- eine tag-Kennzeichnung ist nun konfigurierbar (für keinen, einfach leer lassen) |
|
- Prüfung auf vorhandene Dockerinstallation |
|
- das Dateidatum der Ausgabedatei kann nun auf: Quelldatei, OCR oder JETZT gesetzt werden |
|
- das Umbenennungsdatum kann nun auf: Quelldatei, OCR oder JETZT gesetzt werden |
|
BUGFIXES: |
|
- "beenden erzwingen" war nicht möglich |
|
- Dateidatum der Quelldatei wurde teilweise nicht korrekt auf die Ausgabedatei übertragen |
|
- Minorbugfixes |
|
|
|
0.15.2 [2019-09-03] |
|
IMPLEMENTIERUNGEN: |
|
- erweiterte Auswahl an Dockerimages |
|
|
|
0.15.1 [2019-03-24] |
|
BUGFIXES: |
|
- die temporäre Zieldatei wurde nicht gelöscht |
|
|
|
0.15.0 [2019-03-21] |
|
IMPLEMENTIERUNGEN: |
|
- Die Konfiguration wurde von einer Textdatei auf eine Datenbank umgestellt. So lassen sich jetzt beliebige Profile verwalten. |
|
- Übersichts- und Statusseite zusammengeführt |
|
- INFO: Das Textfeld für die Tags ist zwar jetzt mehrzeilig, es dürfen aber derzeit keine Zeilenumbrüche verwendet werden! |
|
- Detailverbesserungen in der GUI |
|
|
|
0.14.0 [2019-03-10] |
|
IMPLEMENTIERUNGEN: |
|
- es wird jetzt in einem temporären Ordner gearbeitet, damit unerfahrene User nicht von leeren Dateien irritiert werden |
|
- über ein Listfeld lässt sich das Image jbarlow83/ocrmypdf-polyglot (mit allen Sprachen) auswählen |
|
BUGFIXES: |
|
- das Handling der Dateirechte wurde geändert |
|
|
|
0.13.1 [2019-02-24] |
|
BUGFIXES: |
|
- Fehler bei der Benutzerberechtigung. Die Berechtigung zu synOCR kann in der Systemsteuerung/Berechtigung konfiguriert werden (bitte beachte, dass nur eine gemeinsame Konfiguration verwendet wird!). |
|
|
|
0.13.0 [2019-02-17] |
|
IMPLEMENTIERUNGEN: |
|
- durch Voranstellen eines Paragrafenzeichen kann ein Tag alleinstehend gefunden werden (§tag) |
|
- in der Statistik werden jetzt auch einzelne Seiten gezählt |
|
- (der Suchpräfix ist als Standard [bei Neueinstallationen] nicht mehr vorbelegt) |
|
BUGFIXES: |
|
- Fehler bei der LOG-Ausgabe beim Aufruf über den Aufgabenplaner |
|
|
|
0.12.1 [2019-02-05] |
|
IMPLEMENTIERUNGEN: |
|
- zeigen unterschiedliche Tags auf ein und dieselbe Kategorie, so wird die Datei nur einmal in den Kategorieordner verschoben |
|
BUGFIXES: |
|
- Das Sonderzeichen "&" im Dateinamen führte zu einer falschen Umbenennung (es sollte grundsätzlich auf Sonderzeichen im Dateinamen verzichtet werden!) |
|
- ein falscher Exit-Status bei einer leeren Aufgabenliste führte dazu, dass der Aufgabenplaner fälschlicherweise von einem Error ausging und ggf. eine entsprechende Benachrichtigungsmail versendete |
|
- Tags mit Leerzeichen wurden nicht erkannt, sofern sie ohne Kategorie gesucht wurden |
|
- verbesserte LOG-Ausgabe beim Aufruf über den Aufgabenplaner |
|
- der Originaldateiname wurde z.T. bei der Umbenennung nicht korrekt weiter verarbeitet |
|
- Verbesserung der Dateizählererweiterung wenn man die erste Datei ohne Zähler verschoben hatte, bzw. die Originaldateien schon einen Zähler in der Form (1) hatten. |
|
|
|
0.11.0 [2019-01-29] |
|
IMPLEMENTIERUNGEN: |
|
- Tags und Kategorien können jetzt Leerzeichen enthalten (eine Suche nach Tag "Rechnung " findet so nicht fälschlicherweise "Rechnungsstellung") |
|
- Schalter, um Tags als Kategorie zu verwenden (manche wollen vielleicht für jeden Tag einen eigenen Ordner). Eine separate Kategoriezuweisung erübrigt sich in diesem Fall |
|
- Schalter, um im gesamten Dokument zu suchen (nicht nur auf der ersten Seite / Gefahr von false positive Ergebnissen steigt!) |
|
- PDFs die einen Error hervorrufen, werden in den Unterordner "ERRORFILES" im Quellverzeichnis verschoben, um deren wiederholte Verarbeitung zu vermeiden |
|
BUGFIXES: |
|
- eine Installation auf Geräten, die nur inoffiziell Docker unterstützen, war nicht möglich |
|
- kleinere Detailverbesserungen |
|
|
|
0.10.0 [2019-01-21] |
|
IMPLEMENTIERUNGEN: |
|
- es kann nach Tags im OCR-Text gesucht werden |
|
- es kann nach Datum im OCR-Text gesucht werden |
|
- es kann eine eigene Umbenennungssyntax angegeben werden |
|
- Tags können einer Kategorie zugeordnet werden (entsprechende Unterordner werden im Zielordner erstellt) |
|
BUGFIXES: |
|
- ein fehlender Zielordner wurde ggf. nicht erstellt |
|
- der Zähler für offene Jobs war z.T. nicht korrekt |
|
|
|
0.9.3 [2019-01-16] |
|
IMPLEMENTIERUNGEN: |
|
- Dateisuche ist jetzt case insensetive (Suchpräfix / .pdf .PDF) |
|
- Suchpräfix kann nun automatisch entfernt werden |
|
BUGFIXES: |
|
- leere LOGs wurden z.T. nicht korrekt gelöscht |
|
- bei einem OCRmyPDF Error wurde das Skript z.T. nicht korrekt abgebrochen |
|
- kleinere Korrekturen |
|
|
|
0.9.2 [2019-01-11] |
|
- This is the initial public release of the package
|
|
|