Einfach zu integrierende Sprachsteuerung für Embedded Design

Bob Blumenscheid, leitender Produktmarketing-Manager, Digi International
22. Juni 2022

Holen Sie sich unser White PaperErfahren Sie, wie Sie das Design sicherer Geräte beschleunigen könnenPDF HERUNTERLADEN

In diesem Blogbeitrag stellen wir Ihnen folgende Themen vor Digi ConnectCore® Sprachsteuerungeine neue Lösung in Digi's Familie von Embedded-Lösungen die die Sprachverarbeitung auf Geräten am Netzwerkrand ermöglicht, ohne dass eine Cloud-Konnektivität erforderlich ist. Es gibt viele Gründe, warum die Sprachintegration im Produktdesign heute von großem Interesse ist und warum wir ein Wachstum in diesem Bereich sehen werden, da Anwendungen in vertikalen Branchen interaktive Spracherkennung integrieren.

Die Benutzerfreundlichkeit hebt ein erfolgreiches Produkt oft von den anderen Produkten auf dem Markt ab. Für OEMs, die Lösungen mit eingebetteten Datenverarbeitungsfunktionen entwickeln, bedeutet dies oft, dass sie eine intuitive, benutzerfreundliche Produktoberfläche schaffen müssen. Und es gibt kaum eine benutzerfreundlichere Schnittstelle als die sprachgesteuerte Bedienung eines Geräts.

Zu den Vorteilen der Sprachsteuerung gehören bessere Hygiene, schnelle Interaktion zwischen Mensch und Maschine, präziser Betrieb und vieles mehr. Durch die Verarbeitung vor Ort werden Verbindungskosten und Datenschutzbedenken reduziert, während gleichzeitig schnellere Reaktionszeiten als bei der cloudbasierten Sprachverarbeitung möglich sind.

Menschen und Maschinen auf dieselbe Seite bringen

Beispiel für die Sprachsteuerung eines automatisierten externen Defibrillators
Viele Produkte mit eingebetteten Datenverarbeitungssystemen erfordern Benutzereingaben und zeigen Informationen an, die von den Benutzern des Geräts verstanden werden oder auf die sie reagieren müssen. Dieser Teil der Produktfunktionalität wird als Mensch-Maschine-Schnittstelle (HMI) bezeichnet. Heute wird die HMI in der Regel über Bildschirme bereitgestellt, und die Methoden der Benutzereingabe haben sich von Tasten, Mäusen und Tastaturen zu Touchscreens entwickelt, die die Bedienung unserer Smartphones nachahmen.

Ab 2022 erwarten die meisten Nutzer eine Smartphone-ähnliche Schnittstelle für elektronische Produkte. Für OEMs kann es jedoch schwierig und teuer sein, diese in Embedded Linux zu entwickeln, und sie benötigen talentierte UI-Entwickler und zusätzliche Software-Tools für grafische Benutzeroberflächen (GUI), um diese zu erstellen. Die Software kann zwar quelloffen sein, aber leistungsfähigere Tools erfordern in der Regel den Kauf einer Entwicklungsumgebung und die Lizenzierung für Geräte.

Darüber hinaus ist die Touchscreen-Hardware für das fertige Produkt teuer und erhöht die Stücklistenkosten für eingebettete Produkte erheblich. Ein Glasdisplay kann im täglichen Gebrauch in industriellen Umgebungen leicht zerbrechen oder beschädigt werden, was teure Reparaturen oder Ersatz erfordert. Ein weiteres Problem, mit dem Gerätehersteller in der Medizin- und Lebensmittelbranche konfrontiert sind, ist der Hygienefaktor und das Problem der Übertragung von Bakterien auf Oberflächen zwischen Benutzern.

Schließlich bieten die meisten für den Smartphone-Markt konzipierten Touch-/Display-Produkte nicht die lange Lebensdauer (10+ Jahre), die von kommerziellen oder industriellen Produkten erwartet wird.

Sprachsteuerung - die ideale Schnittstelle zwischen Mensch und Maschine

Die ideale Antwort auf viele dieser Probleme liegt in der Sprachsteuerung. Sprachgesteuerte Geräte ermöglichen es den Nutzern, mit einem Gerät aus der Ferne zu interagieren, auch wenn sie nicht sehen können, womit sie interagieren. Das bedeutet, dass sie sich auf die jeweilige Aufgabe konzentrieren können und nicht auf das Gerät.

Sprache ist auch eine sehr effiziente Form der Dateneingabe. Die meisten Menschen sprechen etwa 150 Wörter pro Minute, verglichen mit einer durchschnittlichen Tippgeschwindigkeit von 40. Diese beiden Vorteile zusammengenommen ermöglichen es den Benutzern, relativ komplexe Anfragen schnell zu stellen.

Die Sprachsteuerung bietet erhebliche Vorteile in industriellen Anwendungen, wo sie zum Beispiel die Sicherheit der Benutzer erhöhen kann, die sich auf die eigentliche Aufgabe konzentrieren können, anstatt ein Gerät durch Berührung zu steuern. In einem medizinischen Umfeld wie einem Operationssaal ermöglichen sprachgesteuerte Geräte eine berührungslose Interaktion, was dazu beiträgt, die Übertragung von Bakterien zu vermeiden.

Einführung von Digi ConnectCore Sprachsteuerung

Digi ConnectCore Sprachsteuerung
Digi ConnectCore Voice Control ist eine gebrauchsfertige Softwarelösung, die in Digi Embedded Yocto vorintegriert ist, für die Verwendung mit der Digi ConnectCore Familie von System on Modules (SOMs). ConnectCore Voice Control bietet Echtzeit-Spracherkennung und Text-to-Speech-Funktionen mit einem anpassbaren Weckwort, einem anpassbaren Wortschatz mit 60.000 Wörtern und Unterstützung für 30 Landessprachen.

ConnectCore Voice Control bietet jedem Gerät mit einem Digi ConnectCore Modul eine vollständige Sprachverarbeitung auf IoT und ermöglicht so eine berührungslose Benutzerinteraktion mit dem Gerät. Für den Betrieb sind keine hardwarebasierten AI/ML-Beschleuniger erforderlich, sodass Produktentwickler ohne zusätzliche Hardwarekosten Sprachfunktionen hinzufügen können, die über handelsübliche Mikrofone und Lautsprecher hinausgehen.

Sprachverarbeitung funktioniert besser am Rande

Sprachsteuerung für Parkuhren
Warum die Verarbeitung am Rande von IoT durchführen? Wenn Sie beliebte Sprachsteuerungsanwendungen wie Apple Siri oder Amazon Alexa verwenden, haben Sie vielleicht eine leichte Verzögerung bei der Interaktion bemerkt, selbst wenn Sie das Gerät in der Hand oder auf dem Küchentisch haben. Diese Verzögerung wird durch die Tatsache verursacht, dass die Computerverarbeitung hinter fast allen Sprachsteuerungsanwendungen für Verbraucher in der Cloud durchgeführt wird.

Während ein paar Zehntelsekunden Verzögerung kein Problem darstellen, wenn Sie einen Song auswählen oder eine Textnachricht senden, kann diese Latenz die Sprachsteuerung beim Informationsfluss oder bei präzisen Einstellungen weniger effektiv machen. Natürlich verschlimmert jede Unterbrechung der Konnektivität zur Cloud das Problem.

ConnectCore Voice Control hingegen führt die Sprachverarbeitung lokal, am Rande des Geräts, durch und ermöglicht so eine Echtzeitleistung mit Reaktionszeiten von weniger als 100 Millisekunden. Die geräteinterne Sprachverarbeitung mit ConnectCore Voice Control ermöglicht eine Reaktion in Echtzeit, verglichen mit variablen Latenzen bei der Sprachverarbeitung in der Cloud. Außerdem entfallen die Verbindungskosten von Cloud-basierten Lösungen.

30 Sprachen, 60.000 Wörter

Die meisten Sprachsteuerungsanwendungen auf dem Markt funktionieren nur in zwei Sprachen - Englisch und Mandarin-Chinesisch. ConnectCore Voice ist in der Lage, in 30 Landessprachen zu kommunizieren, was einen großen Vorteil bei der Entwicklung eines Produkts für den globalen Einsatz darstellt.

Durch die lokale Verarbeitung von Daten werden Datenschutz- und Sicherheitsprobleme, die bei der Übertragung von Daten an Cloud-Dienste über das Netz auftreten, praktisch eliminiert. Sie schützt die Privatsphäre der Daten, da sie nie mit dem Internet verbunden werden müssen. ConnectCore Voice Control ist mit der Allgemeinen Datenschutzverordnung (GDPR) der Europäischen Union konform, ein weiterer wichtiger Vorteil für den globalen Einsatz.

Anwendungsfälle der Sprachsteuerung

Sprachsteuerung für industrielle Anwendungsfälle
Die Sprachsteuerung ist eine wertvolle Fähigkeit für eine Vielzahl von Anwendungsfällen. Wenn man bedenkt, dass die meisten Menschen etwa 150 Wörter pro Minute sprechen, während die durchschnittliche Tippgeschwindigkeit bei 40 Wörtern pro Minute liegt, ist es von enormem Wert, die Geschwindigkeit und Präzision in einer Reihe von Szenarien der Mensch-Maschine-Interaktion zu verbessern. Hier sind einige Beispiele:

Smart City und Einzelhandel
- Parkuhren
- Informationskioske oder Terminals, die Wegweiser- oder Veranstaltungsinformationen liefern
- Verkaufsautomaten
Industrielle Tätigkeiten
- Die Steuerung von Industriekränen mit Sprachausgabe ermöglicht es dem Kranführer, das zu bewegende Material zu beobachten, anstatt eine Steuereinheit zu bedienen.
- Robotersteuerung, die es dem Benutzer ermöglicht, Vorgänge mit voreingestellten Befehlen auszulösen
- Prozesskontrolle, z. B. in rauen Umgebungen, in denen Handschuhe erforderlich sind und Touchscreens nicht gut funktionieren
- Messgeräte mit Sprachsteuerung zur Erfassung von Sensormesswerten und anderen Messdaten
- Arbeitsberichte der Techniker und Datenerfassung
Medizin und Gesundheitswesen
- Geräte im Operationssaal - die Interaktion mit Geräten über Sprache bietet Vorteile in Bezug auf Komfort und Hygiene gegenüber Touchscreens oder Tastaturen
- Häusliche Pflege - Protokollierung von Medikamenten, Behandlungen usw. durch das Pflegepersonal
- Medizinische sprachgesteuerte Checklisten in Krankenhäusern, z. B. zur Vorbereitung/Überprüfung von Patienten vor einer Behandlung
- Die Transkription klinischer Notizen bietet mehr Effizienz

Hinzufügen von Digi ConnectCore Sprachsteuerung zu Ihrem nächsten Produkt

Für OEM-Entwickler, die eine Sprachschnittstelle für ihr nächstes Produkt in Erwägung ziehen, entweder als aktuelle Funktion oder als zukünftige Erweiterung, bietet Digi ConnectCore Voice Control vorintegrierte, gebrauchsfertige Software für die Entwicklung auf Digi ConnectCore Modulen.

Die Entwicklungssoftware steht auf der Dokumentations-WebsiteDigi ConnectCore Voice Control zum Download zur Verfügung. Als Teil des Downloads stellt Digi eine einzelne Softwarelizenz zur Evaluierung und Entwicklung für Kunden bereit, die bereits ein Digi ConnectCore 8M Nano Development Kit erworben haben. (Für den Einsatz können OEMs Lizenzen vom Softwareanbieter oder über Digi für jedes von ihnen verkaufte Gerät erwerben). Dieser Software-Download kann zur Entwicklung eines Proof-of-Concept, zur Demonstration von Sprachfunktionen und zur Entwicklung der Sprachsteuerungsanwendung für ein neues Kundenprodukt verwendet werden.

Um mehr zu erfahren, laden Sie das Digi ConnectCore Voice Control Datenblatt herunter.

Nächste Schritte

Möchten Sie mit einem Digi-Experten sprechen? Kontaktieren Sie uns
Möchten Sie mehr von Digi hören? Melden Sie sich für unseren Newsletter an
Oder kaufen Sie jetzt für Digi-Lösungen ein: Wie Sie kaufen

Tagged

Eingebettet Drahtloses Design

Einfach zu integrierende Sprachsteuerung für Embedded Design

Menschen und Maschinen auf dieselbe Seite bringen

Sprachsteuerung - die ideale Schnittstelle zwischen Mensch und Maschine

Einführung von Digi ConnectCore Sprachsteuerung