Business Card Scanner

Prozessautomatisierung zur Effizienzsteigerung und Informationsgewinnung

Business Card Scanner

Unsere „Business Card Scanner“-Lösung zielt darauf ab, die Extraktion und Validierung von Informationen aus Visitenkartenbildern zu automatisieren. Mithilfe modernster Optical Character Recognition (OCR) und Natural Language Processing (NLP) Methoden werden die auf den Visitenkarten enthaltenen Daten erfasst, validiert und in ein strukturiertes JSON-Format umgewandelt. Diese Lösung bietet eine effiziente und zuverlässige Möglichkeit, wichtige Informationen wie Namen, Positionen, Firmenangaben und Kontaktdaten aus verschiedenen Kartenformaten zu extrahieren. Dabei legen wir viel Wert auf Datenschutz – der Business Card Scanner kann lokal ausgeführt werden und die Daten verbleiben auf dem ausführenden Gerät..


Die Herausforderung

Visitenkarten gibt es in unterschiedlichsten Designs, Schriftarten und Sprachen, was die manuelle Verarbeitung und Erfassung von Informationen zeitaufwendig und fehleranfällig macht. Zu den größten Herausforderungen zählen:

  • Vielseitige Formate: Unterschiedliche Layouts, Schriftarten und Logos erfordern flexible Erkennungsmethoden.
  • Sonderzeichen: Telefonnummern, E-Mail-Adressen und URLs enthalten oft spezielle Zeichen, die präzise erkannt werden müssen.
  • Hohe Genauigkeit: Die extrahierten Informationen müssen fehlerfrei und gut strukturiert sein, um eine direkte Weiterverarbeitung zu ermöglichen.

Die Lösung

Unsere Lösung kombiniert leistungsstarke OCR-Modelle und ein lokal ausgeführtes, großes Sprachmodell (LLM), um eine präzise und strukturierte Extraktion von Visitenkartendaten sicherzustellen. Der Prozess umfasst folgende Schritte:

1. Textextraktion mit OCR:

  • Verwendung der OCR-Bibliotheken EasyOCR und PyTesseract zur zuverlässigen Erkennung von Text auf Visitenkarten.
  • EasyOCR bietet exzellente Textdetektion, während PyTesseract sich bei der Erkennung von Sonderzeichen, wie in Telefonnummern und E-Mail-Adressen, auszeichnet.
  • Durch die Kombination beider Modelle wird eine robuste Extraktion erreicht.

2. Datenvalidierung mit LLM:

  • Einsatz des Phi3.5 Language Models, um die extrahierten Daten zu validieren und etwaige Ungenauigkeiten der OCR auszubessern.
  • Das Modell stellt sicher, dass die Ergebnisse kontextuell und strukturell korrekt sind.

3. Strukturierte Ausgabe in JSON:

  • Die validierten Daten werden im JSON-Format gespeichert, das Felder wie Vorname, Nachname, Rolle, Firmenname, Adresse, Telefon, Mobilnummer, Fax, E-Mail und Website umfasst.

Die Ergebnisse

Der entwickelte Prototyp liefert eine flexible und skalierbare Lösung für die Extraktion von Informationen aus Visitenkarten. Zu den wichtigsten Ergebnissen gehören:

  • Präzise Textextraktion: Durch die Kombination von EasyOCR und PyTesseract wird eine hohe Genauigkeit bei der Texterkennung gewährleistet.
  • Kontextbezogene Validierung: Der Einsatz des Phi3.5 LLMs sorgt für vollständige und verlässliche Daten.
  • Strukturierte Ausgabe: Die Daten werden in einem standardisierten JSON-Format bereitgestellt, das eine einfache Weiterverarbeitung ermöglicht.
  • Breite Anwendbarkeit: Die Lösung kann mit einer Vielzahl von Schriftarten, Layouts und Sprachen umgehen.

Ansprechpartner


Dr.-Ing. Jonathan Lehr
Vertrieb
consulting@who-needs-spam.micronova.de
+49 8139 9300-0

Mehr

News: Whitepaper: Methodik der ECU-Virtualisierung realer Hardware für Software-Tests mehr

Presse: Wirtschaftsförderung in Dachau: Einblicke in Hightech-Unternehmen mehr

Karriere: Machine Learning Operations Engineer (m/w/x) mehr

MicroNova - Kontakt


MicroNova AG
Unterfeldring 6
85256 Vierkirchen

    +49 8139 9300-0
    info@who-needs-spam.micronova.de

» Anfahrtsplan

Desktop