27.05.2018

Kostenlose, integrierte Spracherkennungslösungen …

Firmen stehen in der heutigen Zeit zunehmend unter Druck, mobile Apps einzuführen und jedes Jahr steigt die Zahl der Unternehmen, die solche Apps erfolgreich implementieren. Welche App für einen Fachbereich jedoch die richtige ist, wird in einem längeren Prozess entschieden, bei dem der Fachbereich und die IT-Abteilung oft unterschiedliche Ansichten haben. Auch mobile Diktat Apps, die Sprache zu Text umwandeln sind keine Ausnahme. Mobile Spracherkennungs Apps bieten gegenüber einem regulären Diktiergerät mit Spracherkennung viele Vorteile und moderne Diktiersoftware wird klassische Diktiergeräte in naher Zukunft verdrängt haben.

Ein wesentlicher Grund zur Einführung einer MDM-Lösung ist nicht nur die Möglichkeit zur Remotekonfiguration der Smartphones, sondern vor allem der Schutz der Unternehmensdaten vor dem Zugriff durch Ditte. Auf dem Markt gibt es verschiedene MDM-Lösungen, die unterschiedliche Ansätze für die App-Integration verwenden. In jedem Fall bedeutet das jedoch einen höheren Aufwand und Kosten. Eine MDM-Lösung ist in einem Unternehmen folglich das wichtigste Kriterium für mobile Apps und dadurch scheiden im Appstore viele Apps aus, die keine Integration mit MDM bieten.

Wenn schließlich eine Wahl getroffen wurde, kommt oft ein Vorschlag aus der Fachabteilung, dass man die integrierte iPhone Spracherkennung, Google Spracherkennung oder die Diktierfunktion von Android verwenden könnte. Die integrierte Sprache-zu-Text-App ist eine kostenlose Spracherkennungssoftware und erlaubt das Diktieren in jedes Textfenster. Das Spracherkennungsprogramm macht den erkannten Text sofort verfügbar und dadurch kann ein iPhone als Diktiergerät verwendet werden. Die Erkennungsrate beim Diktieren mit einem iPhone ist zufriedenstellend und falsch erkannte Wörter können korrigiert werden, nachdem die Sprache in Text umgewandelt wurde.

… und deren Fallstricke

Auf den ersten Blick ist die Sprachsoftware bequem und erspart den Aufwand, Notizen zu diktieren, an die Schreibkraft zu senden und dann zur Überprüfung an den Diktierer zurückzuschicken – allerdings hat die kostenlose Spracherkennung auch einige Tücken.

Das Diktierprogramm funktioniert nur online und ist auf eine gute Internetverbindung angewiesen. Ist dies nicht der Fall, kann die Lösung nicht verwendet werden, da der Audiostream ins Internet gesendet und auf den Servern umgesetzt wird: Die Spracherkennung findet online statt. Neben praktischen Problemen bei schlechter Netzabdeckung ist dies datenschutzrechtlich sehr bedenklich und nicht mit den neuen Datenschutzregeln nach der DSGVO konform, denn die Erkennungsserver des Spracherkennungsprogramms befinden sich im Internet und der Zugriff auf die gesendeten Daten ist unklar und nicht gesichert. Die Daten werden ausgewertet, denn nur auf diese Weise kann der Anbieter die Erkennungsrate verbessern. Zwar erfolgt die Spracherkennung kostenlos, doch der Einsatz des digitalen Aufnahmegeräts kann hohe Kosten nach sich ziehen: Mit der neuen Richtline zum Datenschutz kann der Einsatz einer solchen Lösung je nach Schwere mit einem Bußgeld in Höhe von bis zu 20 Millionen Euro bestraft werden.

Doch nicht nur die Sicherheitsproblematik ist bei der Spracherkennung mit dem iPhone oder Android-Handy zu beachten. Viele Funktionen sind nicht oder nur eingeschränkt verfügbar, denn die integrierte Android Spracherkennung und das iPhone Diktiergerät enthalten lediglich einen allgemeinen Wortschatz. Dieser ist ausreichend für allgemeine Kommunikation, einen Brief oder eine E-Mail – wenn die Spracherkennung in Text allerdings für medizinische Berichte, juristische Korrespondenz oder andere speziellere Bereiche verwendet werden soll, stößt sie schnell an ihre Grenzen und kann nur Teile der Sprache erkennen. Das Problem liegt darin, dass dem allgemeinen Wortschatz keine unbekannten Wörter hinzugefügt werden können, damit diese später erkannt werden.

Anpassungsmöglichkeiten und Offline-Funktionalität

Eine Spracherkennungslösung für mobile Anwender ist nur mit einem installierten Spracherkennungsserver im Unternehmen machbar. Dabei ist die Umsetzung mit Dragon NaturallySpeaking nicht möglich, da die Dragon Diktiersoftware eher für Einzelarbeitsplätze konzipiert ist und nicht den Workflow abbilden kann. Bei der Lösung können unterschiedliche Wortschätze installiert und einzelnen Anwendern zugeordnet werden. Unbekannte Wörter und Textbausteine können ebenfalls Benutzern oder Gruppen hinzugefügt werden.

Nachdem ein Anwender Text diktiert hat, wird dieser über das MDM-VPN-Gateway zum Server gesendet, dort umgesetzt und an den Anwender zurückgeschickt. Auf diese Weise ist auch die Offline Spracherkennung möglich, da die Offline Spracherkennungsdaten bei unzureichender Konnektivität auf dem Mobilgerät verbleiben und bei ausreichender Netzabdeckung automatisch an den Server geschickt werden. Diese Art der Spracherkennung ist nicht kostenlos und teurer als eine mobile Diktierapp – die potentiellen Vorteile führen jedoch aufgrund der eingesparten Ressourcen schnell zur Amortisation.