synOCR ist eine einfache GUI für den Dockercontainer OCRmyPDF auf Synology Diskstation.

Die Downloadseite findest du hier: https://geimist.eu/synOCR/
Hilfe und Diskussion hier im Forum: https://geimist.eu/link/synocrforum
https://geimist.eu/synOCR/
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

234 lines
11 KiB

Release Notes
! ! ! ATTENTION ! ! !
This version only supports DSM6.x
DSM7 version you can found here: https://git.geimist.eu/geimist/synOCR/src/branch/master/PKG_DSM7/CHANGELOG
1.3.0 [2022-xx-xx]
BUGFIXES:
- counting of log and backup files to be deleted was not correct under certain situations
- catching an error message if there are no docker images to be cleaned up
IMPROVEMENT:
- YAML rules: if the value for condition not set - fallback to any
IMPLEMENTATIONS:
- 🔥 Input folder monitoring included (need installed inotify-tools from here: https://synocommunity.com/package/inotify-tools)
to use this: call synOCR-start.sh with parameter start in DSM task scheduler:
/usr/syno/synoman/webman/3rdparty/synOCR/synOCR-start.sh start
a pulsing status icon in the gui indicates an active monitoring
- 🔥 new Python based date search implemented, which also finds written out months (gthorsten)
- a start year for date search can defined in GUI
- a year in future can be defined in GUI as latest year for search
- 🔥 support separator sheet - dokument split pattern can be configured in GUI (Python3 must be installed)
- in GUI user can define: splitpage is first page, is last page or discard
- 🔥 Pictures in the source folder can be converted automatically (Python3 must be installed)
- option to reduce multiple spaces to one (helpful with RegEx)
- the number of pages is now determined with Python - Exiftool and pdfinfo become obsolete (Python3 must be installed)
- Metadata will be add with Python - Exiftool become obsolete (Python3 must be installed)
- set author (get author information from ocr options if set [--author john doe])
- set creation date (depending on which one was defined: OCR, file date, now)
- set keywords
- the conversion from YAML to JSON is no longer done with the binary yq but by Python (Python3 must be installed)
- logging deleted backup files in loglevel 2
- [GUI] notify about updates in main page (because cphub.net is not working)
- [GUI] support for follow machine translated languages (by DeepL)
- Chinese simplified
- Czech
- Japanese
- Danish
- French
- Italian
- Dutch
- Polish
- Russian
- Spanish
- Swedish
- Hungarian
- Turkish
- Portuguese European
- Portuguese Brazilian
1.2.0 [2022-01-11]
IMPORTANT:
- with this version the scheduler is no longer available in the GUI.
Please use the DSM task scheduler!
BUGFIXES:
- RegEx with lookahead / lookbehind for tag names were not possible
- minor bugfixes (thx to tommes)
IMPROVEMENT:
- handling of special characters improved
- cleanup of unused docker images
- DSM notifications: list all possible users
- indicator about valid directorys in GUI
- the order of the tags can now be defined
criterion is the alphabetical sorting of the rule names in the YAML file
- rewrite GUI (thx to tommes)
IMPLEMENTATIONS:
- renaming parameter for the year can now be 2 or 4 digits
(§yocr2 §yocr4 §ynow2 §ynow4 §ysource2 §ysource4)
- added renaming parameter §pagecount (pages of current document)
- all renaming parameter can be used as path components in YAML-rules (except document title [§tit])
- target files can moved to folders named by year
- target files can moved to folders named by year/month
- number of backup files can now be limited (days or number)
1.1.2 [2021-04-21]
BUGFIXES:
- an error when the page counter could not be calculated.
IMPROVEMENT:
- counter for processed pages at aarch64 are now possible if Exiftool is installed
1.1.1 [2021-04-05]
BUGFIXES:
- fixed century check
- fixed name of variable
1.1.0 [2021-03-31]
IMPLEMENTATIONS:
- added the option to define the tag name via RegEx (Parameter tagname_RegEx in YAML file)
- added a counter for processed pages and files per profile (x86_64 only)
- added additional renaming parameters:
§hhsource §mmsource §sssource §hhnow §mmnow §ssnow §pagecounttotal §filecounttotal §pagecountprofile §filecountprofile
- support for CPU aarch64 (statistics work only limited, because pdfinfo is missing).
- improved date search / data to be ignored can be specified in the GUI (thanks to DeeKay1)
BUGFIXES:
- tagsymbol with spaces don't work
- copy file, if hard links are not createable
- it is no longer calculated with expr
- 'force quiet' (GUI) now also terminates the Docker container synOCR
- minor bugfixes
1.0.2 [2020-08-22]
BUGFIXES:
- file date could not be set to source
- if no destination folder was defined in all fulfilled rules (YAML file), the destination file was lost
- file permission of the target file adjusted (664 and ACL-inheritance)
1.0.1 [2020-07-22]
BUGFIXES:
- >condition: all< was not evaluated correctly (YAML-file)
- unnecessary counter supplement of the target file, if no renaming syntax was specified
- YAML-Samplefile was not created correctly if there were spaces in the path
- file permission of the target file adjusted
1.0.0 [2020-07-13]
IMPLEMENTATIONS:
- multilingual GUI (currently German, English)
- advanced rule management (in combination with an external YAML-file -> write Samplefile with button in GUI)
- tags are now independent of the search term (alias - in combination with an external YAML-file)
- source files: a search prefix with preceding "!" inverts the search in filename ( !value )
- source files: a final "$" is used as search suffix in filename ( value$ )
- if the Exiftool is installed, found tags and date are written into the meta data
BUGFIXES:
2 years ago
- if a path refers to an (unmounted) encrypted directory, the program run is aborted
0.17.1 [2020-06-18]
BUGFIXES:
- Fehler, wenn keine Umbenennungssyntax angegeben wurde
0.17.0 [2020-05-10]
IMPLEMENTIERUNGEN:
- Tags können über ein externes Textfile geladen werden
- Dockerimages mit :latest-Tag können automatisch aktualisiert werden
0.16.3 [2020-03-02]
BUGFIXES:
- Problem beim Einsortieren in Tagordner
0.16.2 [2020-02-18]
BUGFIXES:
- Korrektur der Datumserkennung
0.16.1 [2020-02-09]
BUGFIXES:
- Sonderzeichen in tags führte zu fehlerhafter Umbenennung
0.16.0 [2020-01-28]
IMPLEMENTIERUNGEN:
- es steht wieder ein aktuelles "polyglot-Image" mit allen Sprachen zur Auswahl
- manuell heruntergeladene Images stehen ebenfalls zur Auswahl (sofern "ocrmypdf" im Namen enthalten ist)
- eine tag-Kennzeichnung ist nun konfigurierbar (für keinen, einfach leer lassen)
- Prüfung auf vorhandene Dockerinstallation
- das Dateidatum der Ausgabedatei kann nun auf: Quelldatei, OCR oder JETZT gesetzt werden
- das Umbenennungsdatum kann nun auf: Quelldatei, OCR oder JETZT gesetzt werden
BUGFIXES:
- "beenden erzwingen" war nicht möglich
- Dateidatum der Quelldatei wurde teilweise nicht korrekt auf die Ausgabedatei übertragen
- Minorbugfixes
0.15.2 [2019-09-03]
IMPLEMENTIERUNGEN:
- erweiterte Auswahl an Dockerimages
0.15.1 [2019-03-24]
BUGFIXES:
- die temporäre Zieldatei wurde nicht gelöscht
0.15.0 [2019-03-21]
IMPLEMENTIERUNGEN:
- Die Konfiguration wurde von einer Textdatei auf eine Datenbank umgestellt. So lassen sich jetzt beliebige Profile verwalten.
- Übersichts- und Statusseite zusammengeführt
- INFO: Das Textfeld für die Tags ist zwar jetzt mehrzeilig, es dürfen aber derzeit keine Zeilenumbrüche verwendet werden!
- Detailverbesserungen in der GUI
0.14.0 [2019-03-10]
IMPLEMENTIERUNGEN:
- es wird jetzt in einem temporären Ordner gearbeitet, damit unerfahrene User nicht von leeren Dateien irritiert werden
- über ein Listfeld lässt sich das Image jbarlow83/ocrmypdf-polyglot (mit allen Sprachen) auswählen
BUGFIXES:
- das Handling der Dateirechte wurde geändert
0.13.1 [2019-02-24]
BUGFIXES:
- Fehler bei der Benutzerberechtigung. Die Berechtigung zu synOCR kann in der Systemsteuerung/Berechtigung konfiguriert werden (bitte beachte, dass nur eine gemeinsame Konfiguration verwendet wird!).
0.13.0 [2019-02-17]
IMPLEMENTIERUNGEN:
- durch Voranstellen eines Paragrafenzeichen kann ein Tag alleinstehend gefunden werden (§tag)
- in der Statistik werden jetzt auch einzelne Seiten gezählt
- (der Suchpräfix ist als Standard [bei Neueinstallationen] nicht mehr vorbelegt)
BUGFIXES:
- Fehler bei der LOG-Ausgabe beim Aufruf über den Aufgabenplaner
0.12.1 [2019-02-05]
IMPLEMENTIERUNGEN:
- zeigen unterschiedliche Tags auf ein und dieselbe Kategorie, so wird die Datei nur einmal in den Kategorieordner verschoben
BUGFIXES:
- Das Sonderzeichen "&" im Dateinamen führte zu einer falschen Umbenennung (es sollte grundsätzlich auf Sonderzeichen im Dateinamen verzichtet werden!)
- ein falscher Exit-Status bei einer leeren Aufgabenliste führte dazu, dass der Aufgabenplaner fälschlicherweise von einem Error ausging und ggf. eine entsprechende Benachrichtigungsmail versendete
- Tags mit Leerzeichen wurden nicht erkannt, sofern sie ohne Kategorie gesucht wurden
- verbesserte LOG-Ausgabe beim Aufruf über den Aufgabenplaner
- der Originaldateiname wurde z.T. bei der Umbenennung nicht korrekt weiter verarbeitet
- Verbesserung der Dateizählererweiterung wenn man die erste Datei ohne Zähler verschoben hatte, bzw. die Originaldateien schon einen Zähler in der Form (1) hatten.
0.11.0 [2019-01-29]
IMPLEMENTIERUNGEN:
- Tags und Kategorien können jetzt Leerzeichen enthalten (eine Suche nach Tag "Rechnung " findet so nicht fälschlicherweise "Rechnungsstellung")
- Schalter, um Tags als Kategorie zu verwenden (manche wollen vielleicht für jeden Tag einen eigenen Ordner). Eine separate Kategoriezuweisung erübrigt sich in diesem Fall
- Schalter, um im gesamten Dokument zu suchen (nicht nur auf der ersten Seite / Gefahr von false positive Ergebnissen steigt!)
- PDFs die einen Error hervorrufen, werden in den Unterordner "ERRORFILES" im Quellverzeichnis verschoben, um deren wiederholte Verarbeitung zu vermeiden
BUGFIXES:
- eine Installation auf Geräten, die nur inoffiziell Docker unterstützen, war nicht möglich
- kleinere Detailverbesserungen
0.10.0 [2019-01-21]
IMPLEMENTIERUNGEN:
- es kann nach Tags im OCR-Text gesucht werden
- es kann nach Datum im OCR-Text gesucht werden
- es kann eine eigene Umbenennungssyntax angegeben werden
- Tags können einer Kategorie zugeordnet werden (entsprechende Unterordner werden im Zielordner erstellt)
BUGFIXES:
- ein fehlender Zielordner wurde ggf. nicht erstellt
- der Zähler für offene Jobs war z.T. nicht korrekt
0.9.3 [2019-01-16]
IMPLEMENTIERUNGEN:
- Dateisuche ist jetzt case insensetive (Suchpräfix / .pdf .PDF)
- Suchpräfix kann nun automatisch entfernt werden
BUGFIXES:
- leere LOGs wurden z.T. nicht korrekt gelöscht
- bei einem OCRmyPDF Error wurde das Skript z.T. nicht korrekt abgebrochen
- kleinere Korrekturen
0.9.2 [2019-01-11]
- This is the initial public release of the package