Papierloses Büro dank Synology Diskstation und OCR-Scanner

30 Comments

Nicholas

vor 7 Jahren

Diesen Wunsch – papierloses Büro, fertig Ordner – habe ich auch, aber wenn ich Deinen Bericht so lese, dann muss ich leider erkennen, dass dieses Projekt meine informatischen Fähigkeiten klar übersteigt. Eigentlich erstaunlich, dass es scheinbar keine pfannenfertige Lösung zu kaufen gibt, eine seltene Marktlücke!

Like 1

Like 1

Antworten
- Hans
  
  vor 7 Jahren
  
  Wenn du einen modernen Scanner nutzt und direkt auf den Computer scannst, gibt es schon einfache Lösungen mit OCR.
  
  Like
  
  Like
  
  Antworten
Beat

vor 7 Jahren

Danke das ist ein guter Workaround. Meiner sieht ähnlich aus. Scannen PDF auf die Synology Diskstation aber ohne OCR. Weil ich die Dateien mit der Software «DocFetcher» durchsuche inkl. Inhalt. Für mich genügt dieser Workaround.

Like

Like

Antworten
Bastian

vor 7 Jahren

Hallo Hans,
immer wieder spannend zu lesen, welche Lösungswege einzelne User für diese doch erstmal «einfach» klingende Herausforderung wählen. Danke dafür!

Ich nutze zum digitalisieren einen Canon iX500 (kompakt, schnell, Duplex, OCR und er «versucht! eine automatische Benennung – mal besser, mal schlechter).
Im ersten Schritt habe ich direkt in meinen SynologyDrive-Verzeichnis auf dem Mac gescannt und dann mit einem komplexen Regelwerk in Hazel (Automatisierungstool für den Mac) automatisiert benannt und in eine einfache Ordnerstruktur sortiert. Hazel ist ein mächtiges Tool, klappt aber hervorragend, wenn man einmal sein Regelwerk aufgebaut hat. War also durchaus hilfreich für den ersten großen Durchgang der Digitalisierung.

Im zweiten Schritt wollte ich aber auch eine Lösung ohne Mac/PC, direkt auf die Synology. Das war mir dann am Ende auch wichtiger als die Automatisierung. Nun scanne ich analog zu Deinem Ansatz in ein Syno-Verzeichnis und nutze Drive. Da ich heute keine großen Massen mehr Scanne, sortiere ich ab und zu mal händisch, das geht an AUfwand und zumindest was die Erkennung des Dokumentendatums angeht leistet der Canon Scanner einer guten Dienst.

Ich habe auch ebenfalls noch keine Möglichkeit gefunden, eine saubere Sortierung und Benennung auf der Synology zu finden. Man findet Teils umfassendere Möglichkeiten, diese erfordern aber das Aufsetzen von Docker-Container, was mir a) dann doch zu viel Aufwand ist und b) meine Diskstation nicht kann.

Bin zufrieden mit meiner aktuellen Lösung.

Solltest Du neue Erkenntnisse haben oder Deinen Workflow anpassen, wäre ich an einem Update interessiert.

Beste Grüße

Bastian

Like 1

Like 1

Antworten
Michael

vor 7 Jahren

Hey, interessantere Beitrag!
Ich „kämpfe“ sich schon einige Zeit damit eine Lösung zu finden, bei der möglichst viel automatisch läuft.
SynOCR war für mich irgendwie nicht zufriedenstellend, auch wegen den Einschränkungen bei der Benennung.

Mein Laserjet kann leider kein OCR, aber Duplex.
Mittlerweile scanne ich einfach in ein Netzwerkshare, das von den Tracker PDF Tools überwacht wird.
Ja der Rechner muss dazu laufen, aber was besser habe ich noch nicht gefunden.
In den PDF Tools kann ich verschiedene Workflows anlegen, die dann neu eingegangen PDFs abarbeiten.

Somit habe ich direkt Scanoptimierung, OCR, Umbenennung, PDF/A und Verschieben in einen Ordner…

Meine Traumlösung ist aber auch immer noch, dass das alles auf der Syno abläuft.
Ideal wäre ein Mix aus File Juggler und SynOCR, aber so etwas habe ich noch nicht gefunden…

Like

Like

Antworten
Markus Döbeli

vor 7 Jahren

Sali Hans, schön, wieder mal einen Bericht über Synology zu lesen.
Unabhängig vom Thema «Papierloses Büro» spiele ich mit dem Gedanken, eine DS918+ (Variante ohne HDD) anzuschaffen, stellte dabei aber fest, dass BRACK.ch relativ weit (+12%) vom Preisführer entfernt ist. Meine Quelle war Toppreise.ch. Kannst Du da was in die Wege leiten?
Viele Grüsse, Markus

Like

Like

Antworten
Mario Frei

vor 7 Jahren

Danke für den Beitrag.
Weisst du wie die rechtliche Situation ist bezüglich Aufbewahrung(-spflicht)? Gibt es Dokumente, welche im Original aufbewahrt werden müssen/sollten (z.B. Mietvertag oder Versicherungspolicen)?
Ich habe vor kurzer Zeit recherchiert und habe leider keine befriedigende Antwort dazu gefunden.
Beste Grüsse, Mario

Like

Like

Antworten
Tom

vor 7 Jahren

Coole Idee! Wenn du die eingescannten Files anschliessend zu SharePoint Online hochlädst solltest du diese eventuell mittels Microsoft Flow (entsprechende O365 Lizenz erforderlich) umbenennen können – ich habe einige Beispiele gefunden welche das in Kombination mit OCR ermöglichen könnten… getestet habe ich nichts aber vielleicht könnte das die Lösung sein.

https://elasticocr.com/knowledgebase/using-elasticocr-with-microsoft-flow

https://flow.microsoft.com/en-us/galleries/public/templates/6e60dee37b7a4b8499b5a4217571c7ef/ocr-and-rename-pdf-and-image-files-in-sharepoint-using-aquaforest-pdf/

Vielen Dank für den spannenden Beitrag.

Liebe Gruess
Tom

Like

Like

Antworten
Tom 2

vor 7 Jahren

Bezueglich automatischem Re-naming und Sortierung/Verschieben aufgrund des OCR Inhaltes: Das muesste mit dem bereits weiter oben erwaehnten Tool «Hazel» gehen:

https://www.noodlesoft.com/forums/viewtopic.php?f=4&t=6844

Das muss ja nicht zwingend die ganze Zeit geschehen, sondern einfach wenn Du Deinen Mac laufen laesst: dann laeuft Hazel mit den entsprechenden Rules ueber einen definierten ‚incoming scan‘ Folder auf dem Synology Share und benennt und verschiebt die Dokumente entsprechend.

(Aber habs selber auch noch nicht ausprobiert, bzw. haengt wohl etwas damit zusammen wieviel Zeit man fuer die verschiedenen Rules investieren will – bei haeufig gescannten Dokumenten mit der gleichen Struktur sollte es aber gut gehen).

Like

Like

Antworten
Michael

vor 7 Jahren

Habe das via google drive script gebastelt (das einordnen) – Drive macht das OCR sowieso selber. Ging einigermassen gut, OCR hat halt seine Grenzen…

Like

Like

Antworten
toengi

vor 7 Jahren

Sali Hans, ich habe es etwas anders gelöst. Ich nutze DEVONthink Pro, mit einer Abgleich zu Evernote. Hat den Vorteil, dass ich die DEVONthink DB lokal auf dem NAS ablegen kann und über Evernote von überall Zugriff habe. (War sehr hilfreich bei der Beantragung der C-Bewilligung, wo sie noch ein Dokument benötigten). Zusätzlich bietet DEVONthink soviel Möglichkeiten zur automatisierten Kategorisierung.

Like

Like

Antworten
MichiMichi

vor 7 Jahren

Hallo zusammen
Vielen Dank für den Beitrag, welchen ich gerade versuche durchzuspielen.

Wenn ich die zwei Links zum Synology-Forum überfliege, brauche ich für beide Versionen aber Docker, richtig?
Ich habe vor etwa einem Monat gelesen, dass Docker Ende 2019 eingestellt wird.
Somit würde die Anleitung hinfällig, oder übersehe ich etwas?

Danke für dein Feedback.
Gruss, michi

Like

Like

Antworten
Michi

vor 7 Jahren

Update: Habe gerade direkt ins Synology-Forum geschrieben und folgende Antwort erhalten:
NUR DDSM für Docker wird eingestellt. Mit Docker selbst hat das nichts zu tun! Docker gibt es weiterhin für die Synologys.

Like

Like

Antworten
Matthias

vor 7 Jahren

Hallo ich habe mir auch den Canon 732cdw zugelegt aber ich bin mit der OCR Erkennung nicht wirklich zufrieden. Funktioniert die bei dir gut und hast du evtl einen Tipp die Erkennung zu verbessern?

Vielen Dank dir für immer sehr tollen und interessanten Artikel.

Like

Like

Antworten
Michael

vor 6 Jahren

Hallo Hans

Danke für diesen Beitrag, durch den ich auf die Canon i-sensys Reihe aufmerksam geworden bin.

Ich besitze ebenfalls eine Synology Diskstation (bei mir ist es die DS415+), mit welcher ich die Dateien in unserem Haushalt via Drive Station zwischen den verschiedenen Apple-Geräten und der DS synchronisieren lasse. Die Synology wird dann mittels Synology C2 nochmals gesichert.

Da ich auch so gut es geht papierlos arbeite, ist mir OCR ebenfalls sehr wichtig. Bisher verwendete ich den ScanSnap ix500 von Fujitsu, mit welchem aber leider immer über den iMac gescannt werden musste (mit der meiner Meinung nach recht unübersichtlichen ScanSnap Software). Da ich gerne direkt auf die Drive Station in der Synology scannen möchte, habe ich mir jetzt mal den Canon i-sensys MF744cdw gekauft und hoffe, dass die OCR einigermassen gut funktioniert (man liesst da zum Teil, das manche nicht so zufrieden sind?).

Vielen Dank nochmals für deine tollen Artikel & alles Gute.
Michael

Like

Like

Antworten
Markus

vor 6 Jahren

Hallo Hans

Immer wieder interessant Deine Beiträge zu lesen.
Ich handle das Papierlose Büro schon seit 3 Jahren mit einem Syno NAS 1512 und ein HP M177fw. Alles was noch an Papier in den Briefkasten flattert, ist nicht mehr viel, scanne ich via der HP Smart direkt in ein Ordner auf dem Syno Drive. Funktioniert soweit gut, muss den iMac nicht mal starten sondern alles via iPad/iPhone und gut ist. OCR läuft mir direkt auf dem NAS mittels synOCR, dieses überwacht den Ordner im Syno Drive.
Einzig ausstehendes Thema momentan ist die automatische Benennung von Dokumenten aufgrund Schlüsselwörter im Text. Hast Du da schon was neues?

freundliche Grüsse

Like

Like

Antworten
Tammo

vor 6 Jahren

Danke für den interessanten Beitrag. Wenn man keine Angst vor ein bisschen PHP-Code hat, kann ich https://github.com/stweiss/FileBasedMiniDMS/ für OCR und die automatisierte Einsortierung empfehlen. Das Script starte ich als Cronjob stündlich aus dem Aufgabenmanager heraus. Das Script benutzt ocrmypdf via Docker, man braucht also eine Docker-fähige Diskstation. Im Wesentlichen tut das Script drei Dinge in zwei Phasen

1.1. Es überwacht einen Ordner (bzw ein bestimmtes Dateinamenmuster) auf neue Scans und legt einen OCR-Layer darüber.
1.2. Es sucht nach einem Datum und bestimmten Schlüsselwörtern (die werden in der config.php als Regeln definiert) und lässt die in die Dateinamen einfließen. Das Ergebnis ist in der Form .pdf — also z.B. 2015-12-25 Bill of Santa Clause #bills #2015.pdf
2. Es erzeugt eine Ordnerstruktur auf Basis der Hashtags und sortiert die Dokumente per symlinks dort rein.

Finde ich außerordentlich praktisch.

Like

Like

Antworten
Mäxle

vor 6 Jahren

Danke für die Denkanstöße. Ich stehe davor, alles noch zu digitalisieren. Ich möchte außerdem nur einmal im Monat alle Dokumente in einem Rutsch scannen und anschließend trennen/umbenennen und verschieben lassen. Richtig genial wäre das unabhängig von meinem PC, also direkt auf der Syno. Hab aber noch keine Lösung gefunden.

Like

Like

Antworten
lisa

vor 6 Jahren

Vielen Dank, dass du deinen Workflow mit uns teilst! Ich möchte mir auch einen i-SENSYS Multifunktionsdrucker kaufen und möchte Faxbestätigungen in einem bestimmten Verzeichnis auf meiner NAS speichern und mithilfe von File Juggler die Faxbestätigungen nach 12 Monaten nach Erstellungsdatum löschen lassen. Leider bin ich nicht schlau geworden ob der Multifunktionsdrucker noch Faxbestätigungen auf einer NAS speichern kann? Bleibt alle gesund! Grüße

Like

Like

Antworten
Peter

vor 6 Jahren

toengi says
16. August 2019 at 10:19

„Sali Hans, ich habe es etwas anders gelöst. Ich nutze DEVONthink Pro, mit einer Abgleich zu Evernote. Hat den Vorteil, dass ich die DEVONthink DB lokal auf dem NAS ablegen kann und über Evernote von überall Zugriff habe.“

Wie hast du das gelöst, dass du von Evernote Zugriff auf die DEVONthink DB auf dem NAS bekommst? Soviel ich weiß, können Evernote Einträge lediglich in Dt importiert werden oder sehe ich das falsch?

Like

Like

Antworten
Adrian

vor 6 Jahren

Hallo Hans,

Vielen Dank für dein interessanten Bericht.
Ich bin über die Google-Suche auf deine Seite gestossen.
Ich will zu Hause genau das gleiche umsetzten.

Ich habe aber aktuell ein Problem, bei dem ich keine Lösung bis jetzt gefunden habe:
Habe Synology Drive ebenfalls und die Indizierung ebenfalls angewählt – auch mehrfach neu indiziert.
Leider erhalte ich unterhalb des Datei-Namen immer ein «-«.
Bei keiner Datei ist ein Inhalt zusehen wie bei Dir.
Einige Dokumente habe ich sogar erneut durchsuchbar gemacht – leider ohne Erfolg.

Hat jemand eine Idee, was ich nicht korrekt eingestellt habe?

Danke vorab

Like

Like

Antworten
bebop1983

vor 6 Jahren

Hallo Hans,

kannst du ein wenig mehr auf die Einrichtung des Druckers eingehen?
Hab mir den Drucker gekauft und möchte ebenso (Scan to NAS) verfahren wie du es beschrieben hast.

Viele Grüße

Like

Like

Antworten
- bebop1983
  
  vor 6 Jahren
  
  Hab alles eingerichtet, war eigentlich kein Thema. Funktioniert wie gewünscht
  
  Like
  
  Like
  
  Antworten
Guido

vor 5 Jahren

Ich habe mir mit meiner Synology DS716+ auch einen «papierlosen» Workflow erstellt. Zunächst scanne ich mit einem Brother 1700W in einen Ordner auf der NAS. Hier greift sich dann die App SynOCR meine Dokumente, bearbeitet diese per OCR und legt einen durchsuchbaren Layer an. Im nächsten Schritt kommt die App «Organize» zum Einsatz. Diese bearbeitet alle verarbeiteten PDF-Dateien und sucht nach bestimmten Schlagworten. Werde diese gefunden, benennt Organize diese Dateien um und verschiebt die Dokumente in die korrekten Ordner.

Einen sehr großen Mehrwert bringt mir dann eine Suchsoftware, bei mir Copernic Desktop Search. Damit können alle durchsuchbaren PDFs extrem schnell und einfach gefunden werden.

Like

Like

Antworten
- Michael
  
  vor 5 Jahren
  
  Hallo Guido, das klingt sehr interessant. Wenn ich in den Paketen nach der App «Organize» suche, finde ich diese nicht. Ich habe eine DS 218+ im Einsatz. Könntest Du mir bitte noch einmal die genaue App-Bezeichnung mitteilen. Vielen Dank!
  
  Like
  
  Like
  
  Antworten
  - Hendrik
    
    vor 5 Jahren
    
    Hi Michael,
    
    das sollte dir helfen:
    https://www.synology-forum.de/threads/vom-gescannten-dokument-zur-gefundenen-pdf-datei.108106/
    
    Like
    
    Like
    
    Antworten
Marco George

vor 5 Jahren

Hallo Guido, bist du denn mit dem 1700W zufrieden? Bin gerade auf der Suche nach einem Dokumentenscanner,kannst du mir bei der Einrichtung auf die NAS eventuell helfen? Hier mal meine Whats app nr 01727328339
würde mich sehr über hilfe freuen

Like

Like

Antworten
Gregor

vor 5 Jahren

Hallo Hans

Es ist wirklich immer wieder interessant, zu lesen, wie das Ziel «papierloses Büro» von verschiedenen Menschen erreicht wird. Ich für meinen Teil verfolge dieses Thema bereits seit 10 Jahren.

Nun habe ich dies so gelöst dass ich vom Scanner in einen Netzwerkordner Namens OCRinput auf meinem unRaid Server (intern) scanne. Alles was da drin landet wird von einem Docker OCRmyPDF verarbeitet und danach im PDF/A Format in den Netzwerkordner OCRoutput verschoben. Die meisten dieser indexierten Dateien werden ohne Umbenennung in einen Archivordner auf meinem Nextcloud Server (extern) verschoben. Nur sehr wenige Dateien landen in Projektordner (auch auf nextcloud) wo ich allenfalls auch noch andere dazugehörende Dateien habe. Aber ich nenne keine Dokumente um, welche ich zu 99.7% eh nicht mehr brauche. Also z. B. Rechnungen, Lieferscheine oder AB’s. Ich finde diese ja sowieso wieder wenn ich bspw. die Rechnungsnummer eingebe in nextcloud.

So ist für mich ein perfekt Funktionierendes Archiv entstanden wo alles per Suche wieder auffindbar ist.

Weiterhin viel Spass.
Gruess Gregor

Like

Like

Antworten
Tobias

vor 5 Jahren

Hallo Hans

Ich habe ebenfalls eine Synology Disk Station und arbeite mit dem Synology Drive. Die PDFs wurden mit OCR bearbeitet und die Indexierung ist abgeschlossen. Nichts desto trotz werden keine einzigen Texte erkannt. Mache ich etwas falsch oder muss man noch etwas auf der Syno einstellen?

Besten Dank und Grüsse
Tobias

Like

Like

Antworten
Frank

vor 5 Jahren

Das mit dem das und dem dass, das solltest du nochmal nachlesen: http://www.das-dass.de

Like

Like

Antworten

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Papierloses Büro dank Synology Diskstation und OCR-Scanner

Anforderungen: Papierloses Büro

Scannen auf Synology Diskstation

OCR auf der Synology

Synology Drive als Dokumenten-Index

Fazit

Ich bin Hans.

Hat Ihnen der Artikel gefallen? Bitte teilen Sie Ihre Gedanken mit anderen.

Lesen Sie die beliebtesten Artikel aus anderen Kategorien

PV-Eigenverbrauchsoptimierung: Warmwasser-Boiler Regelung selbst gebaut

Frameo – der digitale Bilderrahmen mit Sharing-Funktion im Test

Mit dem Solar Manager den Eigenverbrauch der PV-Anlage erhöhen

PV-Anlage mit Energiespeicher Varta Element 12 nachgerüstet

Lohnt es sich die Heizung (Wärmepumpe) während den Ferien runter zu regeln?

Elektroauto und Photovoltaik perfekt kombiniert: Easee & Solar Manager

Papierloses Büro dank Synology Diskstation und OCR-Scanner

Anforderungen: Papierloses Büro

Scannen auf Synology Diskstation

OCR auf der Synology

Synology Drive als Dokumenten-Index

Fazit

Ich bin Hans.

Hier klicken, um die Antwort abzubrechen.

Hat Ihnen der Artikel gefallen? Bitte teilen Sie Ihre Gedanken mit anderen. Hier klicken, um die Antwort abzubrechen.

Lesen Sie die beliebtesten Artikel aus anderen Kategorien

PV-Eigenverbrauchsoptimierung: Warmwasser-Boiler Regelung selbst gebaut

Frameo – der digitale Bilderrahmen mit Sharing-Funktion im Test

Mit dem Solar Manager den Eigenverbrauch der PV-Anlage erhöhen

PV-Anlage mit Energiespeicher Varta Element 12 nachgerüstet

Lohnt es sich die Heizung (Wärmepumpe) während den Ferien runter zu regeln?

Elektroauto und Photovoltaik perfekt kombiniert: Easee & Solar Manager

Hat Ihnen der Artikel gefallen? Bitte teilen Sie Ihre Gedanken mit anderen.