Dokumentenmanagement
Als Alternative zu einem Fujitsu SnapScan steht nun daheim ein Kyocera M5526cdw, der auch einen doppelseitigen Scanner besitzt. Leider kann er jedoch keine eingebaute Texterkennung.
Unter https://github.com/elektro-wolle/imap-pdf-ocr baute ich dafür einen kleinen Service, der ein Mailpostfach abfragt, eine OCR auf alle PDF-Anhänge neuer Mails mittels tesseract durchführt und dann die OCR-Version per Mail versendet.
Mittels “Kurzwahltaste” (was für Begriffe aus der Fax-Ära) sendet der Drucker nun die Scans via Mail an den OCR-Prozess und wenige Sekunden später landet das verarbeitete Dokument dann in meiner Inbox.