14. August 2019
4 Minuten zu lesen

Papierloses Büro dank Synology Diskstation und OCR-Scanner

How To- papierloses Büro mit Synology

Vor einiger Zeit habe ich nach einem Workaround für ein papierloses Büro mittels OCR Scan und Netzwerkspeicher gesucht. Richtig glücklich wurde ich bisher mit keiner Lösung, aber mittlerweile habe ich eine Variante die mich zufrieden stellt. Wie ich  das mittels meines neuen Multifunktionsgeräts und meiner Synology Diskstation 1019+ eingerichtet habe, erkläre ich in diesem Beitrag. Zuerst aber nochmals meine Anforderungen, weil zahlreiche Inputs immer von anderen Grundvoraussetzungen ausgingen.

Anforderungen: Papierloses Büro

Für mich ist wichtig, dass ich Korrespondenz auf Papier einfach und jederzeit einscannen kann. Ob das Rechnungen, Lieferscheine, Arztdokumente oder andere Infos sind, einfach alles einscannen und ablegen. Da ich zwischendurch einen Drucker brauche, soll das von einem Multifunktionsgerät erledigt werden können und nicht noch ein separater Scanner. Zwingend ist dabei, dass kein Computer / Mac benötigt wird. Der Scan soll direkt auf der Synology Diskstation abgelegt werden. Dort hätte ich gerne das die Scans einem OCR Workflow durchlaufen und damit durchsuchbar werden. Am liebsten gleich nach Inhaltskriterien umbenannt und sortiert werden. Schlussendlich sollen alle Dokumente per Volltextsuche auffindbar sein.

Meine Datenablage für OCR Scanning: Synology Diskstation

Meine Datenablage für OCR Scanning: Synology Diskstation

Scannen auf Synology Diskstation

Bei meinem alten Multifunktionsdrucker waren alle Toner durch und ich konnte gerade zum Schnäppchenpreis ein neues Gerät aus der Börse von Arbeitgeber kaufen. Dafür habe ich mich dann schnell entschieden, da dieser Scanner auch Duplex beherrscht. Perfekt also für mein Vorhaben, das Gerät nennt sich übrigens Canon i-SENSYS MF734Cdw. Nun so einfach war dann doch nicht alles, ich brauchte nämlich einige Abende um das Scannen direkt auf ein Netzwerklaufwerk einzurichten. Wer da auch mal Probleme hat, gibt die IP-Adresse der Diskstation ein und macht einen separaten User der nur Zugriff auf eure Scan-Ablage hat und nehmt ein einfaches Kennwort. Mittlerweile funktioniert es aber einwandfrei, ich kann jederzeit scannen, unabhängig ob der iMac gerade an ist oder nicht. Genau so muss es sein.

OCR auf der Synology

Mit diesem Thema habe ich mich lange herumgeschlagen, tollerweise aber konnte ich das mit dem neuen Drucker umgehen. Der kann nämlich selbst PDFs direkt mit Texterkennung durchlaufen lassen und sie abspeichern. Das muss nur in den Einstellungen aktiviert werden, damit kommen die PDFs mit OCR direkt auf der Synology an.

Die meisten von euch werden diese Funktion nicht haben, auch da gibt es Abhilfe. Einerseits bin ich auf dieses Script gestossen, dass zu funktionieren scheint. Andererseits gibt es synOCR, das ist für weniger versierte User mit einer graphischen Oberfläche.

Synology Drive - Dokumente indexieren

Synology Drive – Dokumente indexieren

Synology Drive als Dokumenten-Index

Nun habe ich also die Dokumente als durchsuchbare PDFs auf der Synology Diskstation. Soweit so gut, am liebsten wäre mir nun ein automatisches Renaming anhand von vorhandenen Inhalten. Soweit bin ich aber noch nicht, bzw. ich habe noch keine einfache Lösung gefunden.

Wichtiger ist mir aber, dass die Dokumente indexiert werden und durchsuchbar sind. Würde ich die eingescannten Dokumente lokal auf dem iMac speichern, könnte ich einfach per Spotlight suchen und würde Inhalte finden. Auf der Synology geht das so nicht, dachte ich zumindest. Denn mit «Synology Drive» ist das nämlich möglich, wenn die Option wie im obigen Screenshot gezeigt aktiviert wird. Der Scan-Folder habe ich als Team-Ordner ins Synology Drive gezogen und nun kann jeder User meines NAS auf dem Synology Drive nach eingescannten Dokumenten suchen.

Wie das aussieht zeigt der Screenshot unten. Ich habe eine Auftragsbestätigung eines Handwerkers eingescannt, das Dokument selbst hat einfach den kryptischen Namen, welcher der Scanner vergibt behalten. Suche ich aber im Synology Drive nach Auftragsbestätigung, wird das Dokument anhand des indexierten Inhalts gefunden. Perfekt, genau was ich suchte!

Synology Drive - OCR Suche

Synology Drive – OCR Suche

Fazit

Nach langem hin und her habe ich jetzt einen Workaround der für mich funktioniert. Die Dokumente werden eingescannt, OCR Layer darüber gelegt, auf der Synology Diskstation gespeichert und sind indexiert. Damit sind 90% meiner Anforderungen gedeckt, die letzten 10% wären das automatische Umbenennen und verschieben in entsprechende Ordner. Vielleicht hat da der eine oder andere Leser noch gute Inputs, bin da ganz offen.

Die nächsten Schritte sind nun klar, ich werde versuchen so viel wie möglich auf Papier zu verzichten und das Büro möglichst papierlos zu betreiben. Den perfekten Workflow für Fotos von Systemkamera und mehreren Smartphone-Kameras im Haushalt wird dann das nächste Thema sein….

 

30 Comments

  1. Nicholas

    Diesen Wunsch – papierloses Büro, fertig Ordner – habe ich auch, aber wenn ich Deinen Bericht so lese, dann muss ich leider erkennen, dass dieses Projekt meine informatischen Fähigkeiten klar übersteigt. Eigentlich erstaunlich, dass es scheinbar keine pfannenfertige Lösung zu kaufen gibt, eine seltene Marktlücke!

  2. Beat

    Danke das ist ein guter Workaround. Meiner sieht ähnlich aus. Scannen PDF auf die Synology Diskstation aber ohne OCR. Weil ich die Dateien mit der Software «DocFetcher» durchsuche inkl. Inhalt. Für mich genügt dieser Workaround.

  3. Bastian

    Hallo Hans,
    immer wieder spannend zu lesen, welche Lösungswege einzelne User für diese doch erstmal «einfach» klingende Herausforderung wählen. Danke dafür!

    Ich nutze zum digitalisieren einen Canon iX500 (kompakt, schnell, Duplex, OCR und er «versucht! eine automatische Benennung – mal besser, mal schlechter).
    Im ersten Schritt habe ich direkt in meinen SynologyDrive-Verzeichnis auf dem Mac gescannt und dann mit einem komplexen Regelwerk in Hazel (Automatisierungstool für den Mac) automatisiert benannt und in eine einfache Ordnerstruktur sortiert. Hazel ist ein mächtiges Tool, klappt aber hervorragend, wenn man einmal sein Regelwerk aufgebaut hat. War also durchaus hilfreich für den ersten großen Durchgang der Digitalisierung.

    Im zweiten Schritt wollte ich aber auch eine Lösung ohne Mac/PC, direkt auf die Synology. Das war mir dann am Ende auch wichtiger als die Automatisierung. Nun scanne ich analog zu Deinem Ansatz in ein Syno-Verzeichnis und nutze Drive. Da ich heute keine großen Massen mehr Scanne, sortiere ich ab und zu mal händisch, das geht an AUfwand und zumindest was die Erkennung des Dokumentendatums angeht leistet der Canon Scanner einer guten Dienst.

    Ich habe auch ebenfalls noch keine Möglichkeit gefunden, eine saubere Sortierung und Benennung auf der Synology zu finden. Man findet Teils umfassendere Möglichkeiten, diese erfordern aber das Aufsetzen von Docker-Container, was mir a) dann doch zu viel Aufwand ist und b) meine Diskstation nicht kann.

    Bin zufrieden mit meiner aktuellen Lösung.

    Solltest Du neue Erkenntnisse haben oder Deinen Workflow anpassen, wäre ich an einem Update interessiert.

    Beste Grüße

    Bastian

  4. Michael

    Hey, interessantere Beitrag!
    Ich „kämpfe“ sich schon einige Zeit damit eine Lösung zu finden, bei der möglichst viel automatisch läuft.
    SynOCR war für mich irgendwie nicht zufriedenstellend, auch wegen den Einschränkungen bei der Benennung.

    Mein Laserjet kann leider kein OCR, aber Duplex.
    Mittlerweile scanne ich einfach in ein Netzwerkshare, das von den Tracker PDF Tools überwacht wird.
    Ja der Rechner muss dazu laufen, aber was besser habe ich noch nicht gefunden.
    In den PDF Tools kann ich verschiedene Workflows anlegen, die dann neu eingegangen PDFs abarbeiten.

    Somit habe ich direkt Scanoptimierung, OCR, Umbenennung, PDF/A und Verschieben in einen Ordner…

    Meine Traumlösung ist aber auch immer noch, dass das alles auf der Syno abläuft.
    Ideal wäre ein Mix aus File Juggler und SynOCR, aber so etwas habe ich noch nicht gefunden…

  5. Markus Döbeli

    Sali Hans, schön, wieder mal einen Bericht über Synology zu lesen.
    Unabhängig vom Thema «Papierloses Büro» spiele ich mit dem Gedanken, eine DS918+ (Variante ohne HDD) anzuschaffen, stellte dabei aber fest, dass BRACK.ch relativ weit (+12%) vom Preisführer entfernt ist. Meine Quelle war Toppreise.ch. Kannst Du da was in die Wege leiten?
    Viele Grüsse, Markus

  6. Mario Frei

    Danke für den Beitrag.
    Weisst du wie die rechtliche Situation ist bezüglich Aufbewahrung(-spflicht)? Gibt es Dokumente, welche im Original aufbewahrt werden müssen/sollten (z.B. Mietvertag oder Versicherungspolicen)?
    Ich habe vor kurzer Zeit recherchiert und habe leider keine befriedigende Antwort dazu gefunden.
    Beste Grüsse, Mario

  7. Tom 2

    Bezueglich automatischem Re-naming und Sortierung/Verschieben aufgrund des OCR Inhaltes: Das muesste mit dem bereits weiter oben erwaehnten Tool «Hazel» gehen:

    https://www.noodlesoft.com/forums/viewtopic.php?f=4&t=6844

    Das muss ja nicht zwingend die ganze Zeit geschehen, sondern einfach wenn Du Deinen Mac laufen laesst: dann laeuft Hazel mit den entsprechenden Rules ueber einen definierten ‹incoming scan› Folder auf dem Synology Share und benennt und verschiebt die Dokumente entsprechend.

    (Aber habs selber auch noch nicht ausprobiert, bzw. haengt wohl etwas damit zusammen wieviel Zeit man fuer die verschiedenen Rules investieren will – bei haeufig gescannten Dokumenten mit der gleichen Struktur sollte es aber gut gehen).

  8. Michael

    Habe das via google drive script gebastelt (das einordnen) – Drive macht das OCR sowieso selber. Ging einigermassen gut, OCR hat halt seine Grenzen…

  9. toengi

    Sali Hans, ich habe es etwas anders gelöst. Ich nutze DEVONthink Pro, mit einer Abgleich zu Evernote. Hat den Vorteil, dass ich die DEVONthink DB lokal auf dem NAS ablegen kann und über Evernote von überall Zugriff habe. (War sehr hilfreich bei der Beantragung der C-Bewilligung, wo sie noch ein Dokument benötigten). Zusätzlich bietet DEVONthink soviel Möglichkeiten zur automatisierten Kategorisierung.

  10. MichiMichi

    Hallo zusammen
    Vielen Dank für den Beitrag, welchen ich gerade versuche durchzuspielen.

    Wenn ich die zwei Links zum Synology-Forum überfliege, brauche ich für beide Versionen aber Docker, richtig?
    Ich habe vor etwa einem Monat gelesen, dass Docker Ende 2019 eingestellt wird.
    Somit würde die Anleitung hinfällig, oder übersehe ich etwas?

    Danke für dein Feedback.
    Gruss, michi

  11. Michi

    Update: Habe gerade direkt ins Synology-Forum geschrieben und folgende Antwort erhalten:
    NUR DDSM für Docker wird eingestellt. Mit Docker selbst hat das nichts zu tun! Docker gibt es weiterhin für die Synologys.

  12. Matthias

    Hallo ich habe mir auch den Canon 732cdw zugelegt aber ich bin mit der OCR Erkennung nicht wirklich zufrieden. Funktioniert die bei dir gut und hast du evtl einen Tipp die Erkennung zu verbessern?

    Vielen Dank dir für immer sehr tollen und interessanten Artikel.

  13. Michael

    Hallo Hans

    Danke für diesen Beitrag, durch den ich auf die Canon i-sensys Reihe aufmerksam geworden bin.

    Ich besitze ebenfalls eine Synology Diskstation (bei mir ist es die DS415+), mit welcher ich die Dateien in unserem Haushalt via Drive Station zwischen den verschiedenen Apple-Geräten und der DS synchronisieren lasse. Die Synology wird dann mittels Synology C2 nochmals gesichert.

    Da ich auch so gut es geht papierlos arbeite, ist mir OCR ebenfalls sehr wichtig. Bisher verwendete ich den ScanSnap ix500 von Fujitsu, mit welchem aber leider immer über den iMac gescannt werden musste (mit der meiner Meinung nach recht unübersichtlichen ScanSnap Software). Da ich gerne direkt auf die Drive Station in der Synology scannen möchte, habe ich mir jetzt mal den Canon i-sensys MF744cdw gekauft und hoffe, dass die OCR einigermassen gut funktioniert (man liesst da zum Teil, das manche nicht so zufrieden sind?).

    Vielen Dank nochmals für deine tollen Artikel & alles Gute.
    Michael

  14. Markus

    Hallo Hans

    Immer wieder interessant Deine Beiträge zu lesen.
    Ich handle das Papierlose Büro schon seit 3 Jahren mit einem Syno NAS 1512 und ein HP M177fw. Alles was noch an Papier in den Briefkasten flattert, ist nicht mehr viel, scanne ich via der HP Smart direkt in ein Ordner auf dem Syno Drive. Funktioniert soweit gut, muss den iMac nicht mal starten sondern alles via iPad/iPhone und gut ist. OCR läuft mir direkt auf dem NAS mittels synOCR, dieses überwacht den Ordner im Syno Drive.
    Einzig ausstehendes Thema momentan ist die automatische Benennung von Dokumenten aufgrund Schlüsselwörter im Text. Hast Du da schon was neues?

    freundliche Grüsse

  15. Tammo

    Danke für den interessanten Beitrag. Wenn man keine Angst vor ein bisschen PHP-Code hat, kann ich https://github.com/stweiss/FileBasedMiniDMS/ für OCR und die automatisierte Einsortierung empfehlen. Das Script starte ich als Cronjob stündlich aus dem Aufgabenmanager heraus. Das Script benutzt ocrmypdf via Docker, man braucht also eine Docker-fähige Diskstation. Im Wesentlichen tut das Script drei Dinge in zwei Phasen

    1.1. Es überwacht einen Ordner (bzw ein bestimmtes Dateinamenmuster) auf neue Scans und legt einen OCR-Layer darüber.
    1.2. Es sucht nach einem Datum und bestimmten Schlüsselwörtern (die werden in der config.php als Regeln definiert) und lässt die in die Dateinamen einfließen. Das Ergebnis ist in der Form .pdf — also z.B. 2015-12-25 Bill of Santa Clause #bills #2015.pdf
    2. Es erzeugt eine Ordnerstruktur auf Basis der Hashtags und sortiert die Dokumente per symlinks dort rein.

    Finde ich außerordentlich praktisch.

  16. Mäxle

    Danke für die Denkanstöße. Ich stehe davor, alles noch zu digitalisieren. Ich möchte außerdem nur einmal im Monat alle Dokumente in einem Rutsch scannen und anschließend trennen/umbenennen und verschieben lassen. Richtig genial wäre das unabhängig von meinem PC, also direkt auf der Syno. Hab aber noch keine Lösung gefunden.

  17. lisa

    Vielen Dank, dass du deinen Workflow mit uns teilst! Ich möchte mir auch einen i-SENSYS Multifunktionsdrucker kaufen und möchte Faxbestätigungen in einem bestimmten Verzeichnis auf meiner NAS speichern und mithilfe von File Juggler die Faxbestätigungen nach 12 Monaten nach Erstellungsdatum löschen lassen. Leider bin ich nicht schlau geworden ob der Multifunktionsdrucker noch Faxbestätigungen auf einer NAS speichern kann? Bleibt alle gesund! Grüße

  18. Peter

    toengi says
    16. August 2019 at 10:19

    „Sali Hans, ich habe es etwas anders gelöst. Ich nutze DEVONthink Pro, mit einer Abgleich zu Evernote. Hat den Vorteil, dass ich die DEVONthink DB lokal auf dem NAS ablegen kann und über Evernote von überall Zugriff habe.“

    Wie hast du das gelöst, dass du von Evernote Zugriff auf die DEVONthink DB auf dem NAS bekommst? Soviel ich weiß, können Evernote Einträge lediglich in Dt importiert werden oder sehe ich das falsch?

  19. Adrian

    Hallo Hans,

    Vielen Dank für dein interessanten Bericht.
    Ich bin über die Google-Suche auf deine Seite gestossen.
    Ich will zu Hause genau das gleiche umsetzten.

    Ich habe aber aktuell ein Problem, bei dem ich keine Lösung bis jetzt gefunden habe:
    Habe Synology Drive ebenfalls und die Indizierung ebenfalls angewählt – auch mehrfach neu indiziert.
    Leider erhalte ich unterhalb des Datei-Namen immer ein «-«.
    Bei keiner Datei ist ein Inhalt zusehen wie bei Dir.
    Einige Dokumente habe ich sogar erneut durchsuchbar gemacht – leider ohne Erfolg.

    Hat jemand eine Idee, was ich nicht korrekt eingestellt habe?

    Danke vorab

  20. Guido

    Ich habe mir mit meiner Synology DS716+ auch einen «papierlosen» Workflow erstellt. Zunächst scanne ich mit einem Brother 1700W in einen Ordner auf der NAS. Hier greift sich dann die App SynOCR meine Dokumente, bearbeitet diese per OCR und legt einen durchsuchbaren Layer an. Im nächsten Schritt kommt die App «Organize» zum Einsatz. Diese bearbeitet alle verarbeiteten PDF-Dateien und sucht nach bestimmten Schlagworten. Werde diese gefunden, benennt Organize diese Dateien um und verschiebt die Dokumente in die korrekten Ordner.

    Einen sehr großen Mehrwert bringt mir dann eine Suchsoftware, bei mir Copernic Desktop Search. Damit können alle durchsuchbaren PDFs extrem schnell und einfach gefunden werden.

  21. Marco George

    Hallo Guido, bist du denn mit dem 1700W zufrieden? Bin gerade auf der Suche nach einem Dokumentenscanner,kannst du mir bei der Einrichtung auf die NAS eventuell helfen? Hier mal meine Whats app nr 01727328339
    würde mich sehr über hilfe freuen

  22. Gregor

    Hallo Hans

    Es ist wirklich immer wieder interessant, zu lesen, wie das Ziel «papierloses Büro» von verschiedenen Menschen erreicht wird. Ich für meinen Teil verfolge dieses Thema bereits seit 10 Jahren.

    Nun habe ich dies so gelöst dass ich vom Scanner in einen Netzwerkordner Namens OCRinput auf meinem unRaid Server (intern) scanne. Alles was da drin landet wird von einem Docker OCRmyPDF verarbeitet und danach im PDF/A Format in den Netzwerkordner OCRoutput verschoben. Die meisten dieser indexierten Dateien werden ohne Umbenennung in einen Archivordner auf meinem Nextcloud Server (extern) verschoben. Nur sehr wenige Dateien landen in Projektordner (auch auf nextcloud) wo ich allenfalls auch noch andere dazugehörende Dateien habe. Aber ich nenne keine Dokumente um, welche ich zu 99.7% eh nicht mehr brauche. Also z. B. Rechnungen, Lieferscheine oder AB’s. Ich finde diese ja sowieso wieder wenn ich bspw. die Rechnungsnummer eingebe in nextcloud.

    So ist für mich ein perfekt Funktionierendes Archiv entstanden wo alles per Suche wieder auffindbar ist.

    Weiterhin viel Spass.
    Gruess Gregor

  23. Tobias

    Hallo Hans

    Ich habe ebenfalls eine Synology Disk Station und arbeite mit dem Synology Drive. Die PDFs wurden mit OCR bearbeitet und die Indexierung ist abgeschlossen. Nichts desto trotz werden keine einzigen Texte erkannt. Mache ich etwas falsch oder muss man noch etwas auf der Syno einstellen?

    Besten Dank und Grüsse
    Tobias

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .

Hat Ihnen der Artikel gefallen? Bitte teilen Sie Ihre Gedanken mit anderen.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .