ASKA SmartVoice

Unsere eigenentwickelte Command & Control Spracherkennungsplattform

ASKA SmartVoice basiert auf einem der leistungsfähigsten Command & Control Spracherkenner am Markt. Im Gegensatz zu Diktierlösungen wie Dragon NaturallySpeaking, die große Textmengen umsetzen, ist SmartVoice für einen völlig anderen Einsatz optimiert: kurze Befehle, Zahlenkombinationen und präzise Dateneingabe — auch in Umgebungen mit hohem Geräuschpegel.

Das System arbeitet mit vordefinierten Grammatiken und Erkennungsregeln, die den Ablauf der Eingaben exakt abbilden und die Erkennung extrem robust machen. Diese Grammatiken werden in Abschnitte gegliedert und bei Bedarf aktiviert oder deaktiviert — es kann also nur erkannt werden, was die Anwendung gerade akzeptiert.

Inhalte lassen sich zur Laufzeit nachladen und sogar aus der Zielapplikation auslesen. Der Spracherkenner ist sprecherunabhängig und sofort einsatzbereit. Bei Sprechern mit starkem Akzent kann ein kurzes Training durchgeführt und als Sprecherprofil gespeichert werden.

Echtzeit-Dateneingabe

Kurze Befehle und Zahlenkombinationen schnell und präzise erkennen

🔗

Offene Schnittstellen

Ergebnisse in Datenbanken, Dateien oder direkt in Zielanwendungen übertragen

🎯

Dynamische Grammatiken

Erkennungsregeln zur Laufzeit nachladen und an die Zielanwendung anpassen

🖱️

Anwendungssteuerung

Masken aktivieren, Dialoge öffnen und sogar die Maus positionieren — vor der Datenübergabe

SmartVoice im Einsatz

Drei Beispiele, wie ASKA SmartVoice Arbeitsprozesse in unterschiedlichen Branchen transformiert hat.

Logistik & Post

Portoerfassung mit Spracherkennung

Post Liechtenstein

Ausgangslage

Die Post Liechtenstein bietet Kunden mit hohem Briefaufkommen einen besonderen Service: Briefe können unfrankiert eingeliefert werden, die Portoerfassung übernimmt die Post. Bis 2008 wurden dazu Barcodelabels gescannt, die auf laminierten Vorlagen zusammengestellt waren. Nach jedem Sortiervorgang musste der Scanner erneut aufgenommen, die richtige Position auf dem Blatt gefunden und der Scan durchgeführt werden.

Unsere Lösung

Nach der Umstellung auf SmartVoice tragen die Mitarbeiter ein drahtloses Headset und sprechen die Kürzel direkt während des Sortierprozesses. Die Spracherkennung überträgt die Ergebnisse sofort in dasselbe Eingabefeld wie früher der Scanner. Die Hände bleiben frei, Sortierung und Erfassung finden gleichzeitig statt — nicht mehr als getrennter, nachgelagerter Prozess.

Hände frei für die eigentliche Sortierarbeit
Erfassung und Sortierung zeitgleich statt nacheinander
Deutlich flüssigerer Gesamtprozess
Internationale Logistik

Integration in Paketsortierung

RoyalMail, London · mit Siemens Postal, Parcel & Airport Logistics

Ausgangslage

Im Londoner Sortierzentrum von RoyalMail werden internationale Flugsendungen verarbeitet. An jedem Sortierplatz arbeiteten zwei Personen: Einer platzierte die Sendungen mit der Adressseite nach oben auf das Förderband und diktierte gleichzeitig das Zielland einem zweiten Mitarbeiter am PC. Diese Information diente dem nachfolgenden OCR-Scanner als Vorwissen für den Erkennungsprozess.

Unsere Lösung

Gemeinsam mit Siemens wurde die Spracherkennung so integriert, dass der Mitarbeiter am Band das Zielland direkt per Sprache erfasst — der zweite Arbeitsplatz entfällt. Da die Mitarbeiter stündlich wechseln und Fehlsortierungen hohe Kosten verursachen, wurden zwei unabhängig operierende Spracherkenner parallel eingesetzt, die sich gegenseitig absichern und auch bei starkem Dialekt eine zuverlässige Erkennung gewährleisten.

Ein Mitarbeiter statt zwei pro Sortierplatz
Doppelte Absicherung durch zwei unabhängige Erkenner
Zuverlässig auch bei wechselnden Sprechern und Dialekten
Mobile & Cloud

Spracherkennungsserver für Smartphone-App

Großes deutsches Industrieunternehmen

Ausgangslage

Ein großes deutsches Unternehmen bietet eine kostenfreie iPhone-App, über die Kunden Produktinformationen abrufen können. Die Produktnamen sind jedoch sehr speziell und teilweise sehr lang — Tippfehler waren vorprogrammiert. Standard-Spracherkenner wie Siri lieferten bei diesen Fachbegriffen keine brauchbaren Ergebnisse: aus einem Kugellager wurde schnell eine Kegelbahn.

Unsere Lösung

Wir haben den Spracherkenner für den Einsatz auf einem separaten Server optimiert und als Webservice bereitgestellt. Die iPhone-App wurde angepasst: Nutzer sprechen den Artikelnamen in die Suchmaske, die Audiodaten werden an unseren Server übertragen, dort aus tausenden möglichen Einträgen erkannt und das Ergebnis an die App zurückgegeben.

Spracheingabe erheblich schneller und genauer als Texteingabe
Erkennung aus tausenden Fachbegriffen in Echtzeit
Serverbasierter Webservice — kein lokaler Erkenner auf dem Gerät nötig

Haben Sie eine ähnliche
Herausforderung?

Wir entwickeln maßgeschneiderte Spracherkennungslösungen — sprechen Sie uns an.

✦ Projekt besprechen 📞 +49 7031 7976-0
💬 WhatsApp