Maßgeschneiderte Spracherkennungslösungen, die in der Praxis überzeugen — von der Briefsortierung bis zum Spracherkennungsserver.
Unsere eigenentwickelte Command & Control Spracherkennungsplattform
ASKA SmartVoice basiert auf einem der leistungsfähigsten Command & Control Spracherkenner am Markt. Im Gegensatz zu Diktierlösungen wie Dragon NaturallySpeaking, die große Textmengen umsetzen, ist SmartVoice für einen völlig anderen Einsatz optimiert: kurze Befehle, Zahlenkombinationen und präzise Dateneingabe — auch in Umgebungen mit hohem Geräuschpegel.
Das System arbeitet mit vordefinierten Grammatiken und Erkennungsregeln, die den Ablauf der Eingaben exakt abbilden und die Erkennung extrem robust machen. Diese Grammatiken werden in Abschnitte gegliedert und bei Bedarf aktiviert oder deaktiviert — es kann also nur erkannt werden, was die Anwendung gerade akzeptiert.
Inhalte lassen sich zur Laufzeit nachladen und sogar aus der Zielapplikation auslesen. Der Spracherkenner ist sprecherunabhängig und sofort einsatzbereit. Bei Sprechern mit starkem Akzent kann ein kurzes Training durchgeführt und als Sprecherprofil gespeichert werden.
Kurze Befehle und Zahlenkombinationen schnell und präzise erkennen
Ergebnisse in Datenbanken, Dateien oder direkt in Zielanwendungen übertragen
Erkennungsregeln zur Laufzeit nachladen und an die Zielanwendung anpassen
Masken aktivieren, Dialoge öffnen und sogar die Maus positionieren — vor der Datenübergabe
Drei Beispiele, wie ASKA SmartVoice Arbeitsprozesse in unterschiedlichen Branchen transformiert hat.
Die Post Liechtenstein bietet Kunden mit hohem Briefaufkommen einen besonderen Service: Briefe können unfrankiert eingeliefert werden, die Portoerfassung übernimmt die Post. Bis 2008 wurden dazu Barcodelabels gescannt, die auf laminierten Vorlagen zusammengestellt waren. Nach jedem Sortiervorgang musste der Scanner erneut aufgenommen, die richtige Position auf dem Blatt gefunden und der Scan durchgeführt werden.
Nach der Umstellung auf SmartVoice tragen die Mitarbeiter ein drahtloses Headset und sprechen die Kürzel direkt während des Sortierprozesses. Die Spracherkennung überträgt die Ergebnisse sofort in dasselbe Eingabefeld wie früher der Scanner. Die Hände bleiben frei, Sortierung und Erfassung finden gleichzeitig statt — nicht mehr als getrennter, nachgelagerter Prozess.
Im Londoner Sortierzentrum von RoyalMail werden internationale Flugsendungen verarbeitet. An jedem Sortierplatz arbeiteten zwei Personen: Einer platzierte die Sendungen mit der Adressseite nach oben auf das Förderband und diktierte gleichzeitig das Zielland einem zweiten Mitarbeiter am PC. Diese Information diente dem nachfolgenden OCR-Scanner als Vorwissen für den Erkennungsprozess.
Gemeinsam mit Siemens wurde die Spracherkennung so integriert, dass der Mitarbeiter am Band das Zielland direkt per Sprache erfasst — der zweite Arbeitsplatz entfällt. Da die Mitarbeiter stündlich wechseln und Fehlsortierungen hohe Kosten verursachen, wurden zwei unabhängig operierende Spracherkenner parallel eingesetzt, die sich gegenseitig absichern und auch bei starkem Dialekt eine zuverlässige Erkennung gewährleisten.
Ein großes deutsches Unternehmen bietet eine kostenfreie iPhone-App, über die Kunden Produktinformationen abrufen können. Die Produktnamen sind jedoch sehr speziell und teilweise sehr lang — Tippfehler waren vorprogrammiert. Standard-Spracherkenner wie Siri lieferten bei diesen Fachbegriffen keine brauchbaren Ergebnisse: aus einem Kugellager wurde schnell eine Kegelbahn.
Wir haben den Spracherkenner für den Einsatz auf einem separaten Server optimiert und als Webservice bereitgestellt. Die iPhone-App wurde angepasst: Nutzer sprechen den Artikelnamen in die Suchmaske, die Audiodaten werden an unseren Server übertragen, dort aus tausenden möglichen Einträgen erkannt und das Ergebnis an die App zurückgegeben.
Wir entwickeln maßgeschneiderte Spracherkennungslösungen — sprechen Sie uns an.