Dokumentenmanagement


Als Alternative zu einem Fujitsu SnapScan steht nun daheim ein Kyocera M5526cdw, der auch einen doppelseitigen Scanner besitzt. Leider kann er jedoch keine eingebaute Texterkennung.

Unter https://github.com/elektro-wolle/imap-pdf-ocr baute ich dafür einen kleinen Service, der ein Mailpostfach abfragt, eine OCR auf alle PDF-Anhänge neuer Mails mittels tesseract durchführt und dann die OCR-Version per Mail versendet.

Mittels “Kurzwahltaste” (was für Begriffe aus der Fax-Ära) sendet der Drucker nun die Scans via Mail an den OCR-Prozess und wenige Sekunden später landet das verarbeitete Dokument dann in meiner Inbox.

Kommentare per Mail an post@wolfgang-jung.net.