13. Januar 2016
2 Minuten zu lesen

Papierloses Büro: Scanner mit OCR Workflow ohne Computer

Brother-MFC-93330CDW-OCR-scannenEin Thema treibt mich seit einigen Jahren immer wieder an meine Grenzen, ich möchte ein möglichst papierloses Büro (wer schon nicht) und das soll auch komfortabel sein. Scanner und Drucker habe ich bereits einige getestet, eine ideale Lösung wie ich sie mir vorstelle ist mir aber noch nicht unter die Augen gekommen. Auch mit dem neustes Gerät, welches ich nach einem Tipp von Brack.ch günstig gebraucht erstehen konnte, hält noch nicht was ich mir erhofft hatte. Aber was ich genau will, fasse ich doch mal zuerst zusammen.

Meine aktuelle Lösung habe ich hier dokumentiert.

Papierloses Büro: Wunschlösung

Ich habe mir den Brother MFC-9330CDW über ein Inserat gleich im Nachbardorf günstig gekauft. Dieser ersetzt per sofort alle anderen Drucker und Scanner hier im Haushalt, 2016 soll einfacher werden: Ein Gerät soll alles abdecken. Dies Scan und Druckeinheit soll also alle Aufgaben übernehmen, ich lege schnell eine Rechnung in den Einzug und der Scanner soll diese direkt auf meinem Synology NAS ablegen und richtig benennen. Am liebsten wäre mir hier gleich, dass das Dokument durch ein OCR-Tool läuft und so gespeichert. Für Laien: Solche PDFs sind durch eine Texterkennung gelaufen (OCR) und danach einfach und schnell durchsuchbar. Zusammengefasst also:

  • Keine separate Scanner/Drucker/Kopier Lösung -> Ein Gerät für alles
  • Dokumente mit 4-5 Grundkonfigurationen Scannen und entsprechend ablegen
  • PDF-Dateien mit OCR durchsuchbar speichern
  • Alle Dateien auf Synology NAS verfügbar
  • Kein Rechner muss für Scanvorgang und OCR laufen (NAS only)

Aktueller Stand

Grundsätzlich sind von den fünf genannten Punkten oben die ersten zwei erfüllt. Mit dem Brother MFC-9330CDW bin ich grundsätzlich sehr zufrieden, wenn er direkt selbst OCR könnte wäre natürlich genial. Zudem kann ich mir Presets zusammenstellen und die Dokumente so in Unterordner nach Krankenkasse, Rechnungen, Steuerunterlagen usw ablegen. Das direkte Scannen auf das Synology NAS ist auch problemlos möglich, kein Rechner wird benötigt. Offene Punkte bleiben also die OCR-Thematik und mein Wunsch, dass dazu kein Rechner angeschalten sein muss.

Eure Lösungen

Wer von euch arbeitet auch in Richtung «papierloses Büro», schlägt sich mit OCR rum und will keinen Rechner zusätzlich dafür laufen lassen? Bin gespannt auf eure Inputs…

68 Comments

  1. Michael

    Das papierlose Büro macht nur dann Sinn, wenn man seine Dokumente schnell und zuverlässig findet. Hier halte ich (persönlich) die Ablage auf dem NAS als nicht zweckmäßig. Meiner Kenntnis nach indiziert Spotlight auf dem Mac das NAS (zumindest Synology) nicht, so dass hier das System nicht unterstützt.

    Ich habe mich dazu entschlossen, über einen Fujitsu SacSnap Scanner (scannt beidseitig in einem Vorgang) alles in die Software Devonthink (Pro) zu scannen. Die Intelligenz der Suche ist dermaßen überzeugend, dass 99.99% aller Suchen ohne Klicken in die selbst geschaffene Ordnerstruktur der Datenbank unmittelbar zum Ziel führen. Dazu lassen sich auch Emails, etc. in die Datenbank werfen. Die Software unterstützt durch künstliche Intelligenz (die wirklich den Namen verdient) auch bei der Sortierung der gescannten Dokumente in die Ordner der Datenbank und liefert (mittelmäßig) Schlagworte während des OCR Vorgangs.

    Sicherlich hat so ein geschlossenes System auch Nachteile, für mich gibt es derzeit keine effizientere Lösung. Ich verwende mein NAS dann zur Sicherung der aus Performancegründen lokal angelegten Datenbank(en).

    Gruß
    Michael

    • Oliver

      Hallo, bin grade am Testen mit Devonthink.. Bis anhin habe ich alles mit dem ix500 gescannt und in Eine Ordnerstrucktur auf das Nas gespeichert. (Synology) Das wieder finden ist dann so eine Sache. Spotlight geht ja so nicht. Es gibt zwar tools Dafür aber wirklich befriedigend war es nicht. Ev hast du ja ein paar Tips für mich wie ich mit Devonthink am besten arbeiten kann.

  2. carzl

    Interessanter Artikel – und ziemlich deckungsgleich mit meinen Vorstellungen 🙂 Ich würde zwar auf einem Windows-Rechner ablegen, da ich eh eine Win10-Büchse habe die 24/7 läuft – das ist mein zentrales Datensilo, dort liegen die .pst- bzw. .ost-Dateien für meine ganzen auf Clients verteilten Outlook´s und dort läuft auch mein TV-Server (Digital Devices TV-Karten mit DVBLink). Aber das nur am Rande, es geht ja um In- und Output von Dokumenten. Sicher ist die Frage was man für die Hardware ausgeben möchte, wichtig ist aber, je nach Druckvolumen, auch wie es auf der Folgekostenseite aussieht; sprich was das s/w- und Farbdrucken an Kosten für Toner etc. nach sich zieht. Mein Wunschsystem ist der Canon i-SENSYS MF724Cdw http://www.canon.de/for_home/product_finder/multifunctionals/laser/i-sensys_mf724cdw/

    Sicher eine Ecke teurer als das Brother-Modell, aber eben mit OCR. Ob man Presets zusammenstellen kann, durch die Ordnerstruktur navigieren kann, Dateinamen übers Display vergeben kann etc. weiß ich leider nicht. Cool wäre noch ein SinglePass-Scanner, also ein Originaleinzug der die Rückseite ohne Wendung der Vorlage scannt. Aber alles Gute hat man halt nie beisammen, ich kenne auch keine Büchse in diesem Segment die das alles vereint.

    Bin auch sehr gespannt auf weitere Kommentare! 🙂

  3. Peter

    Für kleine Datenmengen (privater Haushalt) ist Swisscom DocSafe eine Lösung. Dem Nachteil, die Daten nicht in der «Privat Cloud» zu haben, steht der Vorteil des Backups sowie der universale Zugriff gegenüber.

    Seit Ende Nov 2015 ist die App wirklich brauchbar. D.h. vergleichbar mit Office Lens
    https://play.google.com/store/apps/details?id=com.swisscom.ent.docsafe&hl=de

    Eine App macht für mich Sinn, da das Hand das einzige Gerät ist, dass immer betriebsbereit ist. Leider wird Swisscom kaum eine Windows Universal App heraus geben :-/

  4. Roger

    Dem papierlosen Büro habe auch ich mich 2016 gewidmet. Ich Arbeite mit Evernote (Pro-Account) und der App Scannable. Evernote indiziert beim Bezahl-Account die Inhalte der Scanns und auch meine Handschrift aus Tabletnotizen. Bei der geringen Menge an Papier für mich eine komfortable Lösung. Nicht ideal ist bei dieser Lösung der Datenschutz. Ich nehme aber mal an, dass auch das Synology NAS über ein Backdoor verfügt 😉

  5. Fab

    Netter Beitrag, ein paar Anregungen von mir. Ich bin seit 2015 weitestgehend Papierlos.

    Hierfür nutze ich einen ScanSnap iX500 von Fujitsu. Alle eingehenden Dokumente werden damit gescannt und in einen encFS-«Container» verschlüsselt auf meinem NAS gespeichert. Die ScanSnap Software funktioniert sehr gut, die Texterkennung wird automatisch durchgeführt (PC vorausgesetzt, leider). Schließlich synce ich den encFS-«Container» in meine Dropbox, sodass ich auch von anderen Geräten auf meine Dokumente Zugriff habe. Zudem schiebe ich meine Dokumente wöchentlich per Backup auf einen weiteren externen Datenträger, denn es wäre fatal, wenn schließlich alle Dokumente weg wären.

    Zur Datensicherheit. Auch wenn encFS vielleicht nicht das sicherste ist, ich denke im Groben sollte das schon passen. Absolut kritische Dokumente hebe ich mir im Original auf und werden nicht gescannt.

    Beste Grüße,
    Fab

  6. Ernie

    Nach vielen verschiedenen Fehrlentscheidungen habe ich nun Produkt gefunden, welches alle genannten Anforderungen abdeckt: Die Kodak-Alaris ScanStaion 700 bzw. 710.
    Ich habe sie seit 1,5 Jahren im Einsatz und bin begeistert.
    Hier die Vorteile:
    1. arbeitet ohne PC völlig autark (die Scan werden bei mir auf meiner Synoligy-NAS gespeichert)
    2. hat ein embedded Windows mit einer Festplatte integriert, die ich gegen eine SSD-Platte getauscht habe.
    3. eigener LCD-Bildschirm auf dem pro Seite 9 ICON als Themen (z.B. «Garantie-Beleg», «private Rechnungen», «Haushaltkassen-Belege» etc) abgelegt werden können. Die ICONS können mit eigenen Grafiken und Texten erstellt werden. Nahezu beliebig viele Bildschirmseiten können angelegt werden
    4. Sannt extrem schnell und auch BEIDSEITIG.
    5. schief, quer oder auch falsch (Kopf- uns Fußseite vertauscht) eingelegte Vorlagen werden automatisch gerade als hochkant-lesbares Dokumet ausgerichtet und gespeichert.
    4. pro ICON wird die Art des Scannens einmalig festgelegt: z.B. als PDF, einseitig oder beidseitig, als OCR-lesbar, als JPG, als DOC (WinWord) etc. Auch die Auflösung kann pro ICON definiert werden. Hier sind sehr, sehr viele einzelne Einstellungen pro ICON kombinierbar und einrichtbar. Beispiel: Normalerweise setzt man bei den meisten ICONS den Haken «Ultraschall-Doppelerkennung» damit zusammengeklebte Blätter als Fehler erkannt werden. Ich habe mir zusätzlich ein ICON «ohne Ultraschall-Doppelerkennung» angelegt um Briefumschläge mit aufgeklebten Briemarken oder anderen Vorlagen mit Aufklebern (Haftnotizen etc.) problemlos fehlerfrei scannen zu können
    5. sehr zuverlässiger Einzieh- und Scan-Ergebnisse (hat 600 Seiten Kontoauszüge im C6-Format ohne einen Fehler in einem Durchgang gescannt (musste nur in mehreren Stapeln je 100-150 Seiten nachlegen)
    6. wacht sehr schnell auch dem Sleep-Modus auf 2-3 Sec.
    7. verbraucht im Sleep-Modus nur 6 Watt
    8. die Verarbeitung der gescannten Dokumente läuft im Hintergrund und beeinflusst nicht die sehr hohe Scangeschwindigkeit
    9. ziemlich platzsparenden Form (ohne Deckel)

    natürlich habe ich auch ein paar Dinge entdeckt, die nicht optimal sind:

    a) Die Einrichtung (einmalig) erfolgt mit einer Software auf dem PC, die aus meiner Sicht «steinzeitlich»
    ist. Trost: wenn alles eingerichtig ist, braucht man diese SW nur noch, um Änderungen an der Einrichtitung vorzunehmen. Bei Fragen hilft der deutschsprachige Kodak-Telefon-Support sehr gut.
    b) man kann nur «lose» Vorlagen scannen. Bücher auflegen geht nicht! Ist für mich nicht entscheidend (Zur Not kann ich die Seiten aus dem Buch vorher kopieren)
    c) man kommt nicht an das embedded-Windows ran, weil Kodak die Zugangsdaten nicht freigibt. Ich habe mir deshalb vor der Installation ein Image von der Festplatte gezogen, um bei möglichen Problemen nicht von Kodak abhängig zu sein. (hatte aber bisher keine!). Hier noch ein Vorteil: Die Einrichtungsdatei mit allen ICONs, Pfaden und Parametern wird (bei jeder Änderung der Einrichtung) auf dem PC gespeichert und kann jederzeit auf eine neue ScanStation übertragen werden (wenn Euch diese z.B. durch Blitzschlag «abraucht» oder gestohlen wird)
    d) das größte Handicap ist sicherlich der Preis: Stand heute (13.Jan.2016) wird die ScanStation 710 bei Amazon für 1693,-€ angeboten. ABER: nach vielen schlechten Erfahrungen mit permaneten Fehlern beim Einzug, keinem doppelseitigen Scan, langsamer Scangeschwindigkeit, Betrieb nur mit PC und Zusatzsoftware möglich, habe ich mit diesem Teil genau das gefunden, was ALLE meine Anforderungen (und andere, die ich noch garnicht getestet habe) erfüllt. Insofern habe ich mal wieder am eigenen Kaufverhalten der Vergangenheit gelernt: Der Sparsame zahlt zweimal!

    Mehr Informationen bekommt Ihr hier:

    http://www.kodakalaris.de/de-de/b2b/products/document-scanners/networked/scan-station-710

    und noch etwas: Ich bin überhaupt kein Freund von ALL-IN-ONE-Geräten: Wenn eine Funktion Funktion dieser Geräte ausfällt, fällt meistens auch das ganze Gerät aus. Meine Frau hat (z.B) eine Farb-Drucker-Sanner-Kombination von Samsung «mit in die Ehe» gebracht mit der ich vorher versucht habe, zu scannen.
    Ergebnis: Immer wenn EIN Toner (der verschiedenen Farben) der Druckeinheit zur Neige ging (und das war wegen der kleinen Behälter häufig der Fall) konnte man auch nicht scannen. Da wird man zu Tier!

    netten Gruß

    Ernie

    • Markus

      Für die Bücher gibt es passend ein ziemlich geniale Auflageeinheit, die man daran anschließen kann und man kann dann sogar «gemischt» scannen.

      Das Gerät hatte ich beruflich wegen seiner Leistung bestellt. Wird in einer Mittelstandsfirma für viele tausend Belege im Monat seit einem Jahr sehr gut eingesetzt und die Bedienung ist der Hammer .. steinzeitlich, aber wenn man mal die anderen Systeme durchlitten hat, ist man mit Kodak plötzlich zufrieden.

      • Ernie

        Hallo Marcus,
        das interessiert mich sehr! Kannst du bitte einen Link schicken wo man eine solche Auflagen-Einheit für dieScanStation 700 bzw. 710 beziehen kann? Ich habe beim googeln nichts der gleichen gefunden.

  7. Oliver Gut

    Dieses papierlose Büro beschäftigt mich auch seit längerem 🙂

    Für mich kommt es nicht in Frage, dass teils sehr vertrauliche Dokumente in der Cloud zu liegen kommen. Swisscom, Google Docs oder Evernote kommen daher für mich nicht in Frage. Auch kritisch stehe ich gegenüber einem geschlossenem System (wie die oben beschriebene Software Devonthink) PDF soll PDF mit OCR auf Share bleiben und ich möchte jederzeit die Möglichkeit haben, das ‹Drumherum› (zum Wiederfinden der Dokumente) beliebig austauschen zu können.

    Ich verwende aktuell die App Scanbot auf Android mit der ich sehr zufrieden bin. OCR klappt wunderbar. Die Qualität ist für mich fürs private Umfeld allemal ausreichend (Voraussetzung ist natürlich eine einigermassen gute Handy-Kamera). Ich lagere meine Dokumente/Post auf einem Stapel und ca. 4mal im Jahr ’scanne› ich alles ein und es landet via Webdav auf dem Netzlaufwerk/NAS.

    Der letzte ‹wichtigste› Schritt fehlt mir aber auch noch. Am liebsten wäre mir ein Software, die ich in einer Virtuellen Maschine laufen lassen könnte und die ständig die PDFs auf dem Netzlaufwerk indexiert und mir ein Webinterface für das auffinden/wiederfinden der Dokumente bereitstellt.

    Falls da jemand was hat, lasst es mich bitte wissen.

    • Holger

      Hallo Oliver,

      versuche mal Everything von voidtools. Nutze ich für mein DMS. Indexiert lasse ich nur nach Dateinamen (ich tagge alles in meinem DMS über den Dateinamen). Extrem starke Suchfunktion. Kann auf einer VM einen WebServer zur Verfügung stellen.
      Dein Post ist zwar schon etwas älter, aber vielleicht hilft’s ja noch.

  8. Beat

    Ich bin begeistert vom Scanner Canon P-150 und verwende diesen schon seit Jahren um meine Dokumente und Quittungen zu scannen. Das Portable Gerät hat die Scan-Software und Treiber integriert, kann OCR und Duplex-scan. Schräg eingezogene Dokumente werden grad ausgerichtet. Der einzige Nachteil ist die Geschwindigket der Verarbeitung. Stapeleinzug ist jedoch möglich. Auch das auslassen von leeren Seiten. Abgelegt werden die eingescanten PDF`s auf dem NAS und mit einem Windows-PC synchronisiert.

  9. Tobias

    Verwende einen ix500 bin zufrieden. Schade nur dass es keine Server Software gibt, sprich man muss sich sogar auf dem System anmelden, es genügt nicht wenn der Rechner läuft. Dies würde mich nicht stören der Server läuft immer.

  10. Andy

    Habe den ix500 ScanSnap in Kombination mit DevonThinkPro (zur Dokumentenablage exkl. Rechnungen) und der Buchhaltung ShakeHandsKontor (inkl. Ablage der gescannten Rechnungen) mit meinem iMac im Einsatz. Für TimeMachine-Backup verwende ich eine Synolgoy DS215 mit gespiegelten 4TB WD Red HDs sowie eine alte DS212+ für 2. Generation-Backup der DS215. Funktioniert prächtig und ich kann die Kombination wärmestens empfehlen.

  11. Borsuk

    Ich verwende den Netzwerkscanner Canon ScanFront 300P seit 4 Jahren. Die Scanprofile über das Webinterface einzurichten, ist mit etwas Aufwand verbunden. Aber denselben Aufwand hat man, wenn man sich Scanprofile für einen Desktop-Dokumentenscanner einrichtet. Danach ist das Scannen aber sehr simple: einfach ein Scanprofil auf dem Touchscreen berühren und der Rest inklusive OCR und speichern auf dem NAS, einem Computer im Netzwerk, oder Versand per Email geht automatisch.
    Der Prozessor und Arbeitsspeicher des Scanners sind allerdings aus meiner Sicht etwas unterdimensioniert. Sind mehrere Bildverbesserungsfunktionen (Geraderücken, automatisches Zuschneiden, Entrastern, Durchscheinen verhindern), OCR und 600 dpi gewählt, meldet er, dass er nicht genügend Systemresourcen dafür hat. Wählt man statt dessen 300 oder 400 dpi verarbeitet er die Dokumente wie gewünscht. Will man 600 dpi mit mehreren Bildverbesserungsfunktionen nutzen, dann muß man entweder OCR oder die eine oder andere Bildverbesserungsfunktion weglassen, dann verarbeitet er die Dokumente.
    Zum Scannen zwischendurch ist das Gerät wirklich praktisch. Ganze Stapel an Dokumenten möchte ich damit aber nicht einscannen. Mir ist dafür die Geschwindigkeit zu langsam. Die Auswahl möglicher OCR-Sprachen ist begrenzter als bei den Flachbettscannern und Multifunktionsgeräten von Canon, was ich angesichts des deutlich höheren Preises inakzeptable finde. Wäre das Gerät doppelt oder besser dreimal so schnell, hätte ausreichend Arbeitsspeicher und dieselbe Auswahl an OCR-Sprachen, wie die anderen Geräte von Canon, dann wäre ich damit wunschlos glücklich.

  12. Ben

    Das wird ein etwas längerer Kommentar, hoffe das passt…
    Betreibe das papierlose Büro seit Jahren erfolgreich zuhause. Als Hardware kam erst auch ein HP All-In-One zum Einsatz. Dieser musste aber vor einiger Zeit dem wirklich ausgezeichneten Fujitsu iX500 Scanner Platz machen. Da ich sowieso einen Server in Betrieb habe, ist da eine virtuelle Maschine auf welcher die ScanSnap Software permanent läuft. Übrigens habe ich die Software nicht auf Windows Server 2012R2 zum Laufen gebracht (stattdessen Windows 7). Ein ScanProfil welches doppelseitige PDFs (mit OCR & 600dpi) und Zeitangabe als Dateinamen macht, ist auf den Button am Fujitsu Scanner zugeordnet. Die PDFs werden direkt in einen Ordner auf dem NAS abgelegt (Die Ablage in eine Cloud ist ein klares NoGo in meinem Fall).

    Dateiablage
    Ich bin, nach Tüfteln&Verbessern über die Jahre, zu einer simplen 3-Level-Struktur gekommen.
    Beispiel:
    2015 (Ordner) (1. lvl)
    -Swisscom (Ordner) 2. lvl)
    –2015-05-08-Swisscom-Rechnung.pdf (Datei) (3. lvl)
    –2015-10-11-Swisscom-Abowechsel.pdf (Datei) (3. lvl)
    –2015-11-12-Swisscom-Mahnung.pdf (Datei) (3. lvl)

    Für mich ist damit alles abgedeckt an Informationen.

    Einige machen es komplizierter und haben noch Unterordner wie Rechnung, Mahnung, Bezahlt, Unbezahlt. Wüsste nicht wozu, es steht ja schon im Dateinamen. Zudem scanne ich Rechnungen erst ein, nachdem sie bezahlt wurden.

    Die Dateibenennung mache ich bewusst von Hand. Erstens gibt es keine genug intelligente Software unter Windows um das hinzubekommen (Text an bestimmter Stelle aus PDF nehmen und dann als Dateinamen zuammenschustern) und zweitens habe ich nur noch sehr wenig Papierpost (also wenige Aufwand). Wie ich die Dateien benenne ist oben ersichtlich.

    Automatische Einordnung der Dokumente
    Das war die kniffligste Aufgabe 🙂
    Um nach der manuellen Dateibenennung die automatische Einsortierung in den richtigen Ordner zu automatisieren, verwende ich unter Windows das gratis Tool DropIt ( http://www.dropitproject.com/ )
    Mit dem Programm kann man flexible Regeln erstellen um die Dateien anhand diverser Filter&Faktoren zu identifizieren.
    Habe ich das Dokument also korrekt benannt, verschiebt DropIt das Dokument automatisch.

    Finden einer Datei
    Dank OCR und einer aussagekräftigen Dateibenennung reicht die Windowssuche vollkommen aus um alles aufzufinden.

    Zugriff von extern
    ist auch gewährt, da das NAS eine Weboberfläche und Apps für unterwegs anbieten.

  13. Andreas

    Ich habe mich bewust gegen ein Multifunktionsgerät entschieden und mir den üblichen verdächtigen Scanner zugelegt: ScanSnap iX500 in Zusammenspiel mit Devonthink auf dem Mac. Bin damit relativ zufrieden. Optisch sagen mir die Multigeräte nicht zu, und wenn man eine wirklich gute Scaneinheit haben möchte sind diese Geräte auh nicht billig. Hochwertiger Scanner der länger halten soll und für die paar Ausdrucke im Jahr die ich habe reicht auch ein billiger Laser noch eine ganze Zeit.

    Workflow iX500 und Devonthink gehe ich nicht näher ein, dazu gibt es viele Blogbeiträge im Netz

  14. Anon

    Hi,

    in meinem HomeOffice habe ich über genau dasselbe nachgedacht und wie folgt umgesetzt:

    – Jeder Brief wird eingescannt (ich verwende den HP OfficeJet Pro 8620 Plus – wichtig: Duplex-Scan!)
    – Der OfficeJet packt das PDF auf meinen Server (eine kleine Intel NUC mit Core i3 und Ubuntu)
    – Auf dem Server läuft pypdfcocr in Verbindung mit eigens geschriebenen python-Scripten, welche das PDF OCRen und auf der NAS (4-Bay ZyXEL 540) in OCRT und zur Sicherheit das Original ablegen und mit Datum taggen
    – Auf dem Server läuft zudem ein OpenSemantic Search Server, der täglich alle PDFs indiziert und in einem Webportal (apache, SOLR, Jetty) zum Suchen und filtern zur Verfügung stellt.
    – Das Portal habe ich mit einer einfachen .htaccess geschützt und auch ins Web freigegeben, damit ich von überall darauf zugreifen kann.
    – Derzeit synct mein Hauptrechner noch alles von der NAS und synct danach mit OneDrive. Später sollte das die NAS oder die NUC selbst machen, bin ich aber noch nicht zu gekommen.
    – Per eingebundenem Samba-Share kann ich auch von jedem LAN-Rechner auf die NUC ein PDF schieben, was sofort verarbeitet wird (falls mal eine Rechnung per Mail / digital und nicht per Post kommt)

    Anmerkungen:

    1.) Derzeit funktioniert das opotionale tagging im OpenSemantic Search jedoch noch nicht. Und OpenSemantic Search ist sehr schlecht dokumentiert – muss ich mal gucken, stört mich aber noch nicht wirklich, da ich auch ohne tagging alles finde.

    2.) Der OpenSemanticSearch ist durch eigene Scripte perfekt anpassbar (soll er jedenfalls, noch nicht proibiert, sieht aber gut aus), womit man seine indizierten Dokumente bereits beim indizieren taggen kann.

    3.) Ein Backup der im RAID-5-laufenden NAS sollte zusätzlich auch lokal, vielleicht durch eine zweite NAS erfolgen. Am besten behält man mehrere Versionen, auf genügend Speicherplatz ist also zu achten, da die Vorhaltezeit von Belegen 6 bis 10 Jahre beträgt.

    4.) Ich habe keine AllInOne-Lösung gefunden, die einigermaßen bezahlbar ist. Alle eingesetzte Software ist daher OpenSource und man muss selbst scripten. Wenn man sich damit aber auch nur ein bisschen auskennt, hat man das in maximal einer Woche auf dem Stand, wie ich es jetzt habe. Erweiterungen sind immer möglich, was das tolle daran ist – und man zahlt keine Lizenzgebühren

    MfG,

    Anon

  15. Anon

    Weitere Anmerkungen (Nachtrag):

    5.) Durch Anpassung von Scripten kann man bei meinem System auch seine eigene Ordnerstruktur behalten. Diese wird dann auf der NUC vorgehalten. Schiebt man / Scannt man bspw ein PDF auf die NUC auf
    Code:
    //NUC/Rechnungen/2016/Hausverwaltung/Objekt1/Rechnung.pdf
    wird das Ding OCRed und auf die NAS in
    Code:
    //NAS/Rechnungen_OCR/2016/Hausverwaltung/Objekt1/da-tu-mm_Rechnung.pdf
    gepackt. Im Webinterface vom OpenSemanticSearch kann dann das Suchergtebnis nach Pfaden gefiltert werden, was dann das Auffinden bei sehr vielen Dokumenten und Suchergebnissen ohne Filter extrem beschleunigt.

    6.) OpenSemanticSearch indiziert nicht nur PDFs, sondern auch DOCX, DOC, etc….

  16. Stefan

    Hallo, ich habe den Brother MFC-9340CDW, kann damit Duplex Scannen und Drucken. Ich habe auch OCR (in einem Schritt) sehr vermisst, habe nun aber per Zufall rausgefunden dass wenn man direkt nach Dropbox scannt, dies in einem Schritt möglich ist! Wollte dich das nur wissen lassen. (Sorry habe die anderen Kommentare nicht gelesen).

  17. Almas

    Scan mit OCR bezog sich eher auf das Endergebnis. Ich habe einfach als Ausgangsbasis massig Papier hier liegen, das ich am Ende als durchsuchbare pdf Datei auf dem Rechner haben möchte. Das soll möglichst gut und unkompliziert gehen. Ich weiß tatsächlich noch nicht, wie der workflow mit den Multis dabei genau aussieht. Ich hatte vermutet, das man das in einem Rutsch machen lassen kann (also über DADF einscannen und direkt als durchsuchbares pdf abspeichern lassen).

  18. Tinu

    Hallo allerseites.
    Ich suche seit längerer Zeit ein System für unser Büro und unsere Kunden.
    1. Scanner gibts einige, welche ein PDF mit OCR auf einer Platte ablegen.
    ein günstiger guter Scanner ist Canon imageformula dr-c225w
    2. Meine grösste Herausforderung ist, diese Dokumente gezielt abzulegen
    (z.B nach Doktypen: Kred, Deb, Offerten, Infos, etc.., Absender
    Für eine grössere Anzahl Dokumente kommt man vermutlich nicht um ein DMS?
    Hat jemand eine einfache Lösung. Aktuell bin ich mit ELO am basteln….

    herzliche Grüsse
    Tinu

    • Borsuk

      Zu 2: Vielleicht hilft dir:
      DropIt (www.dropitproject.com) oder Belvedere (https://github.com/adampash/belvedere) oder die umfassendere Lösung FileCenter Professional (www.lucion.com/filecenter-overview.html), die auch den Scanprozess mit abdeckt.
      Bei einem DMS hast du in der Regel das Problems des Vendor Lock-in. Wenn du später zu einem anderen DMS wechseln willst, dann verlierst du meist die Informationen, die du Dokumenten zugewiesen hast, wie zum Beispiel Schlagwörter oder andere Klassifizierungen und fängst wieder von vorne an.
      Für kleine Büros/Firmen kommt man mit der Suchfunktion des Betriebssystems oder einer speziellen Suchsoftware, zum Beispiel DocFetcher (http://docfetcher.sourceforge.net/en/index.html) sehr sehr weit, weil man die Scans ja in der Regel als PDF mit OCR abspeichert.

  19. André B.

    Beim Aufbau meines papierlosen Büros bin ich auf der Suche nach einem Scanner, der die Dokumente selbstständig auf einem Netzwerk-Share ablegt.

    Ich stelle mir das konkret so vor, dass ich eingehende Dokumente mit einer fortlaufenden Nummer versehe und einfach in den Scanner lege. Dieser macht daraus ein PDF (OCR ist nicht zwingend erforderlich) und legt es in einem «Eingangsordner» auf meinem NAS ab. Die restliche Bearbeitung der Dokumente (Dateinamen, ggf. OCR, Ordnerstruktur usw.) kann ich dann gebündelt am PC erledigen, wenn mir danach die Lust steht. Die Nummern auf den Dokumenten dienen lediglich dem Wiederfinden des Papier-Originals, falls ich es mal brauche.

    Während des Scannens möchte ich keine Software bedienen müssen, da ich erst mal nur die Eingangspost schnellstmöglich loswerden will; und weil ich mit Linux arbeite, wofür die Scannerhersteller i.d.R. ja eh keine Software zur Verfügung stellen.

    Momentan verwende ich Scanbot mit meinem Androiden (wie Oliver: https://technikblog.ch/2016/01/papierloses-buero-scanner-mit-ocr-workflow-ohne-computer/#comment-14357) und suche dafür quasi einen vollwertigen Hardware-Scanner-Ersatz, da mich das Handling mit dem Handy ziemlich nervt.

    Kennt jemand einen Scanner (vielleicht sogar einer der oben genannten), der diese Voraussetzung erfüllt? Hier nochmal zusammengefasst:
    – Duplex-Scan-Einheit
    – keine Software beim Scan erforderlich
    – automatisches generieren von PDFs mit voreingestellten Parametern (1 Einstellung reicht)
    – Ablage der PDFs auf einem Netzwerk-Share (über SMB, WebDAV oder FTP)
    – Anbindung ans Netzwerk per LAN oder WLAN
    – Anschaffungskosten <500€

    Würde mich riesig freuen, wenn mir jemand einen Tipp geben könnte!

    Grüße
    André

  20. carzl

    Ich habe mich statt für einen Scanner für ein A4-MFP entschieden, weil ich drucken (in Farbe) gleich mit abdecken möchte. Ich habe die Canon i-SENSYS MF735Cx. Das waren die ausschlaggebenden Punkte:

    – Dual-Scan-Originaleinzug (scannt Vorder- und Rückseite ohne zu wenden, also in einem Rutsch)
    – OCR
    – «Anwendungsbibliothek», damit kann man 5 Schnell-Button auf den Touchscreen legen, hinter denen schon alle Einstellungen liegen (ich hab da «Scannen simplex» und «Scannen duplex», das ganze in den Netzwerkscanordner meiner Frau und von mir)
    – niedriger Druckkosten und größere Tonererstausstattung als bei dem nächstkleineren Modell MF635Cx

    Auf meinem 24/7-Rechner liegt als ein «Neue Scans» Ordner, jeweils im Datenverzeichnis von Mademoiselle und von mir. Dort feuert das MFP alle Scans rein, ohne dass man dabei noch mit irgendeinem Stück Software interagieren muss. Ich habe einen Reiner-Paginierstempel, damit werden alle Papierdokumente durchnummeriert und in dieser Reihenfolge in A4-Archivboxen abgelegt. So finde ich jedes Original blitzschnell wieder. Top-Lösung für mich 🙂

    • André B.

      Wow! Genau so habe ich mir das auch vorgestellt, nur dass ich für den Workflow lieber einen kleinen unauffälligen Scanner hätte, den man auch mal im Schrank verstauen kann. Der Canon i-SENSYS MF735Cx ist schon ein ganz schöner Brocken; ohne explizites Arbeitszimmer wird das nix…

      • carzl

        Ja stimmt – die Kiste ist 47 x 47 cm in der Grundfläche. Wenn man einen kleinen Scanner UND dazu noch einen mehr oder weniger großen/kleinen Drucker hat, dann ist es eine Überlegung, beides gg. EIN, dann aber ggf. größeres Gerät zu tauschen. Ich habe die Kiste im Abstellraum stehen, das geht. Aber wenn man nur einen Schreibtisch irgendwo stehen hat, wo ein kleiner Tintenstrahler unter der Arbeitsplatte Platz findet, dann ist das eher keine Alternative…

        • Borsuk

          Wie lange braucht der i-SENSYS MF735Cx, um ein doppelseitig bedrucktes A4-Blatt zu verarbeiten, d.h. vom Drücken des Scan-Knopfes bis er die Seite mit seiner integrierten Software verarbeitet hat und er bereit ist, ein weiteres Dokument zu scannen (das als eigenes PDF also nicht mit dem ersten Dokument zusammen in einer PDF-Datei gespeichert wird)? Diesbezüglich würden mich 2 Auflösungen interessieren: 300 dpi und 600 dpi inklusive OCR. Danke

        • carzl

          @Borsuk: müsste ich mal messen, aber es liegt auf jeden Fall nur im Sekundenbereich, auch bei 600 dpi und bei mehrseitigen Dokumenten. Wenn man seinen täglichen Schriftkram scannt, also Briefe etc. mit 1, 2 Seiten, dann ist die Kiste schneller fertig als man das nächste Dokument zuführen kann. Ich scanne mit 600 dpi, was für ein DMS eigentlich schon zu viel ist, aber was kostet schon Speicherplatz… Auf jeden Fall hemmt die Scan- bzw. Sendegeschwindigkeit nicht das Arbeiten. Ich meine auch, man kann bei einem umfangreichen Dokument schon das nächste Scannen, während die Kiste noch mit dem vorherigen beschäftigt ist, sie weiß ja, dass die letzte Seite des vorherigen durch war. Ich würde aber auf jeden Fall LAN empfehlen (bei mir über Fritz PowerLAN), nicht WLAN.

        • André B.

          Durch eine umfangreiche Online-Recherche bin ich auf diese Kundenrezension über den Brother ADS-2400N gestoßen , die alle meine Wünsche als abgedeckt vermuten ließ.

          Ich habe das Gerät jetzt seit drei Tagen im Einsatz und bin absolut begeistert! Kurz zu meinen ursprünglichen Anforderungen:
          – Duplex-Scan-Einheit -> erfüllt
          – keine Software beim Scan erforderlich -> erfüllt
          – automatisches generieren von PDFs mit voreingestellten Parametern (1 Einstellung reicht) -> erfüllt (3 Kurzwahltasten)
          – Ablage der PDFs auf einem Netzwerk-Share (über SMB, WebDAV oder FTP) -> erfüllt (SMB, FTP)
          – Anbindung ans Netzwerk per LAN oder WLAN -> erfüllt (LAN)
          – Anschaffungskosten erfüllt (300€)
          – kleine Stellfläche -> erfüllt (b x t x h = 31 x 26 x 25 cm)

          Wer mehr wissen will, lese die obige Rezension oder frage hier.
          Ich kann gerne auf Details eingehen oder was ausprobieren.

        • André B.

          @Hans: OCR geht imho nur mit der mitgelieferten Software im Nachgang auf dem PC. In der Scannerkonfiguration, die man übers Netzwerk direkt per IP anspricht, konnte ich hierzu nichts finden. Da ich Linux einsetze, kann ich zur Software nichts sagen (von Brother wird für Linux nur ein Treiber angeboten).

  21. Thomy

    Interessante Beiträge!

    Ich suche für das noch zu kaufende NAS ein DMS, so wie das hier bereits erwähnte FileCenter. Evernote ist wegen dem externen Speicher (Cloud) bzw. wegen der großen Datenmenge keine Option. EcoDMS waere evtl. eine Option, hat aber den Nachteil, dass die Dokumentation nicht gerade sehr ausführlich ist und das mal existierte Forum eingestellt wurde. Denn der Hersteller bietet das Programm sehr guenstig an, aber bei jeder Anfrage fallen Kosten an. So auch zum Bsp. auf die Frage, ob die DMS auch auf einen 64bit Prozessor laufe.

    Hat jemand mit EcoDMS praktische Erfahrung bezüglich NAS Installation und Anwendung?

    Thomy

  22. Matthias

    Hallo Hans,

    ja ich bin auch genau auf der Suche nach den 5 oben beschriebenen Punkten. Leider finde ich nicht wirklich eine Lösung dafür. Ich würde am liebsten den Scanner ganz stand-alone betreiben und die Dokumente ins Netzwerk ablegen. Ob irgendwo auf einem Server eine Software liegt, die dann die OCR macht und die Dokumente in einem Verzeichnis ablegt oder ob das der Scanner selbst macht ist mir egal. Auch das «Dateien sortieren» würde ich einmal in der Woche selbst machen. Nur will ich nicht einen Rechner anschalten um zu Scannen oder den Text zu erkennen.

    Bist du weiter mit deiner Suche?

    • André B.

      Hallo zusammen, wer sich ein bisschen mit Linux auskennt, könnte dem Scanner auch einen Fileserver auf einem Raspi anbieten und dort ein kleines Script laufen lassen, das den Ordner überwacht und immer bei neuen Dateien eine OCR auslöst und dann die daraus resultierenden Dateien in einem weiteren Verzwichnis ablegt. Z. B. läuft tesseract-ocr auf der Kommandozeile (Infos hier: https://wiki.ubuntuusers.de/Texterkennung/).

  23. Kurgebeat

    Hallo Hans,
    ich habe für meine Büro mit 10 Leuten den CX820dtfe von Lexmark besorgt und wir sind super zufrieden. Es hat eine Dual.Duplex-Einheit, kann zu diversen Netzlaufwerken und -ordnern (SMB, FTP) scannen, hat eine integrierte OCR-Lösung uvm. Druck- und Scanqualität und Geschwindigkeiten sind genial. Das kostet aktuell 4200 € (ich habe es Anfang 2017 für 1700 € bekommen), es gibt aber eine Version mit weniger Trays CX820de (2700€) und ein nahezu identisches Modell CX827D (Scan DPI 600 statt 1200) für 1700 €. Allerdings wiegen die Modell 80 kg. Unser Modell macht darüber hinaus auch im Standby Betriebsgeräusche: Der Lüfter fährt in regelmäßigen Abständen hoch. Je nachdem wo du das Ding hinstellst kann das dann nervig sein. Ansonsten ist es aber super. Deine 5 Anforderungen werden jedenfalls alle erfüllt.
    Ich hoffe, dass hilft dir. VG

  24. tomy78667

    Hallo Zusammen,

    mein papierloses Büro habe ich folgendermaßen verwirklicht:

    1. Einscannen mit meinem Multifunktionsdrucker von Brother auf meinen Raspi
    2. OCR auf dem Raspi (Script läuft auf dem Raspi automatisch ab bei Änderung im Ordner)
    3. Vorder- und Rückseite werden zu einem PDF zusammen geführt (Raspi)
    4. PDF wird nach gefundenen Schlagwörtern umbenannt (Raspi)
    5. Verschieben auf mein NAS

    Das einzige ist nu noch wenn die letzte Rückseite leer ist, ist diese ebenfalls im PDF vorhanden.
    Da muss ich noch eine Lösung finden.

    Zum suchen nehme ich Recoll, das läuft auf dem Raspi und ist per Webbrowser erreichbar.

  25. André B.

    Hallo tomy78667,

    das mit dem Raspi ist echt eine super Idee. Auf dem NAS ist man ja mit Skripten doch immer etwas eingeschränkt… Könntest Du die von Dir erstellten/ verwendeten Skripte (zu 2. & 4.) zur Verfügung stellen?

    In meinem Brother (ADS-2400N) gibt es übrigens die Möglichkeit Leerseiten automatisch auszusortieren. Das sollte Dein Problem mit der letzten Seite also schon vor der Weiterbearbeitung durch den Raspi beseitigen.

    Ich habe mir letzte Woche mit Fsniper und sSMTP eine Konfiguration zusammengebaut, die mir eine E-Mail mit dem Scan sendet, sobald dieser vom Scanner in einem bestimmten Ordner abgelegt wird. Das war nötig, da mein Scanner leider ohne Verwendung der PC Software keine E-Mails senden kann. Diese Automatik läuft aktuell allerdings auf einem lokalen PC, so dass die Mails erst dann gesendet werden, wenn dieser wieder läuft (also ggf. nicht direkt im Anschluss an den Scan, da der Scanner die Dateien auf dem NAS ablegt). Ein Umzug auf meinen Pi wurde soeben eingeplant 🙂 Gerne kann ich die hierfür benötigten Einstellungen auch zur Verfügung stellen.

    Grüße
    André B.

    PS: Wie ich soeben feststelle, entspricht Deine Konfig quasi meinem Vorschlag vom 5. Oktober 2018 – wow!

  26. Rname

    Meine Umsetzung:
    – ADS2400N scannt per SMB in einen Ordner auf dem NAS
    – Dort läuft in einem Container Mayan EDMS (open source)
    – Mayan EMDS überwacht den Scanordner und importiert automatisch
    – Zusätzlich kann man eine E-Mail Adresse einrichten, an die man Dokumente zum import schicken kann
    – Mayan EDMS ist mächtig, kann aber auch schlank genutzt werden
    => Bin sehr zufrieden

  27. Müller

    Hallo Zusammen

    Ich bin ebenfalls an dem Thema interessiert. Hat jemand bereits Erfahrungen mit EcoDMS gemacht?
    Mein Ziel ist es, das ich die Dokumente auf den Scanner legen kann und diese dann „automatisch“ archiviert werden. Auf EcoDMS bin ich gekommen, da es Scanns auftrennen kann. Somit könnte man alle Dokumente (natürlich mit Trennblätter) einmal pro Woche auf den Scanner legen und alle würden Verarbeitet.

  28. Alex

    Hallo Ernie, vielleicht liest du das hier ja irgendwie. Ich hab auch versucht ein Image zu erstellen und auf eine SSD umzuziehen mit meiner Scan Station. Hat leider nicht ganz so geklappt. Kannst du mir eventuell aushelfen? Oder vielleicht kann mir auch Hans weiterhelfen? Besten Dank schonmal!

  29. Bernd

    Hallo Alex, ich habe die Platten direkt kopiert (kein zusätzliches Image erstellt). Ich weiß allerdings nicht mehr genau mit welchem Tool (ist schon sehr lange her). Entweder habe ich das mit einem Stück Hardware (z.B. ein Disk to Disk-Kopierer von Inateck) gemacht, oder ich habe Acronis ist benutzt. Wenn du fertig bist und alles läuft, solltest du trotzdem noch ein Image zu Sicherheit machen.
    Darauf gekommen bin ich eigentlich nur, weil ich das Gerät einmal einschicken musste. Das wollte ich jedoch nie wieder tun müssen und deshalb habe ich sofort nach der Retoure ein Image von der jungfräulichen Platte gemacht.
    So bin ich in der Lage, im Zweifelsfall den Scanner selbst zurück in den Werkszustand zu setzen (auch wenn das Gerät gar nicht mehr hochfährt).
    Ich hoffe, ich konnte dir helfen!

    Netten Gruß
    Bernd

  30. Alex

    Ja ich hab es mit acronis gemacht jedoch wurde das Image nicht verifiziert. Ich hätte es Sektor für Sektor sichern sollen. Ich war leider etwas vorschnell mit dem wipen der Platte 🙁 irgendwas ging schief.
    Wäre es dir möglich mir deine Sicherheitskopie zukommen zu lassen? Es sollten ja keine relevanten Daten in deinem Image sein oder? Das wäre meine Rettung. Viele Grüße Alex

  31. Ernie

    Hallo Alex, ich habe noch mal nachgeschaut und festgestellt, dass das im Image nicht von der jungfräulichen Platte sondern nach Einrichtung (mit Daten) gemacht wurde. Und ein Image mit Daten gebe ich nicht aus dem Haus. Wo wohnst du denn?
    Grüße

  32. Alex

    Ja es hätte mir ja auch nix genutzt wenn dein Image nicht jungfräulich ist. Schade. Ich hätte mich erkenntlich gezeigt. Sei es drum. Aber ich danke dir trotzdem.
    Vielleicht kann mir ja der Support helfen. Viele Grüße

  33. Alex

    Hey Bernd, der support konnte mir leider bisher nur bedingt weiterhelfen. Könntest du mir deine kss.xml – also das config file zukommen lassen?
    Die sollte nicht allzu groß sein und keine persönlichen Daten enthalten. Das wäre prima 🙂
    LG Alex

  34. Alex

    Hallo an alle,
    falls einer nochmal das Problem bei der «Kodak Scan Station 710» mit der KSS.xml hat. Man kann sich das XML File über das KonfigTool selbst erstellen. Es kann danach selbst benannt werden. Damit kann man dann seine eigene Konfiguration erstellen.
    Grüße Alex

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .

Hat Ihnen der Artikel gefallen? Bitte teilen Sie Ihre Gedanken mit anderen.

Diese Website verwendet Akismet, um Spam zu reduzieren. Erfahren Sie mehr darüber, wie Ihre Kommentardaten verarbeitet werden .