PatentDe  


Dokumentenidentifikation DE69831536T2 19.01.2006
EP-Veröffentlichungsnummer 0000893901
Titel Verfahren zur Steuerung eines Telekommunikationsdienst und eines Endgerät
Anmelder Nokia Corp., Espoo, FI
Erfinder Ali-Yrkkö, Olli, 33720 Tampere, FI
Vertreter COHAUSZ & FLORACK, 40211 Düsseldorf
DE-Aktenzeichen 69831536
Vertragsstaaten DE, FR, GB, IT
Sprache des Dokument EN
EP-Anmeldetag 22.07.1998
EP-Aktenzeichen 986600724
EP-Offenlegungsdatum 27.01.1999
EP date of grant 14.09.2005
Veröffentlichungstag im Patentblatt 19.01.2006
IPC-Hauptklasse H04M 1/27(2006.01)A, F, I, ,  ,  ,   

Beschreibung[de]

Die Erfindung betrifft ein Verfahren zur Steuerung eines Telekommunikationsdiensts wie im Oberbegriff von Anspruch 1 definiert und ein Telekommunikationsendgerät wie im Oberbegriff von Anspruch 5 definiert.

Aus dem Stand der Technik ist bekannt, daß ein Telekommunikationsdienst unter Nutzung von Zahlentasten und DTMF-Tönen gesteuert sein kann. Dies ist unpraktisch, insbesondere bei einem Mobiltelefon, da zunächst die Bereitschaftsmeldung gehört werden muß, wobei das Mobiltelefon ans Ohr gehalten wird, wonach das Mobiltelefon zum Drücken der Tasten herabgenommen werden muß, und danach muß das Gerät wieder ans Ohr gehoben werden. Dies muß wiederholt werden, bis alle gewünschten Vorgänge durchgeführt sind.

Spracherkennungsgeräte des Stands der Technik, die in Endgeräten genutzt sind, erkennen die Telefonnummer oder den Namen des angerufenen Teilnehmers. Eine Telefonnummer wird auf Grundlage der Erkennung gewählt und ein Anruf aufgebaut. Davor gibt der Benutzer die individuellen Nummern und Namen sowohl durch Sprache als auch durch Wählen der entsprechenden Nummern in das Endgerät ein. Eine gespeicherte Telefonnummer in dem Endgerät entspricht dem Namen des angerufenen Teilnehmers.

Ein Problem bei den Geräten des Stands der Technik ist, daß die Spracherkennungsgeräte nur zur Erkennung der individuellen Nummern oder des Namens des angerufenen Teilnehmers und zu keinerlei anderen Zwecken genutzt sein kann.

Die Nutzung von Spracherkennung (SR) in Telekommunikationssystemen ist dahingehend bekannt, daß in einer Vermittlung oder einem Dienst, der der Vermittlung zugeordnet ist, Stimmbefehle erkannt werden. Derartige Dienste sind jedoch selten und die Mehrheit der Dienste erfordert, daß der Benutzer die Nummern während des Anrufs wählt.

Ein Problem bei den Spracherkennungsgeräten des Stands der Technik ist, daß sie selten sind, so daß die meisten der derzeitigen Dienste mithilfe einer Tastatur zu nutzen sind. Ein weiteres Problem ist eine unzuverlässige Spracherkennung aufgrund von Unterschiedlichkeiten der Stimmen der Benutzer.

Die Patentschrift WO 9712361 beschreibt einen Telefonnetzdienst zum Umwandeln von Sprache in Tastenwahl, wobei gesprochene Worte in individuelle DTMF-Töne zur Zuleitung an ein automatisiertes System umgewandelt werden, das auf die Tastenwahlsteuerung davon anspricht. Das daraufhin erzeugte DTMF-Signal wird dann an ein automatisiertes System wie ein Stimmübermittlungssystem oder einen Anrufbeantworter zur Steuerung dessen Betriebs übertragen. Ein derartiger Netzdienst kann für den Fall, daß das Telefon ein Wähl- oder Drehimpulstelefon ist, oder unter Umständen, in denen es vorzuziehen ist, zu sprechen anstatt Tasten einer Telefontastatur zu drücken, eingesetzt sein.

Die Patentschrift JP 02013166 beschreibt einen Sender, der zum Verbessern der Erkennungsrate und zum Senden eines effizienten Kompressionssignals durch Senden eines Codes, welcher einer Stimme eines Sprechers entspricht, an eine entgegengesetzte Zentrale angeordnet ist. An einem Stimmerkennungsabschnitt wird eine von einem Sprecher über ein Handgerät eingegebene Stimme als ein Wort erkannt. Worte und Code entsprechen einander eins zu eins in einer Stimme-Code-Vergleichstabelle. Die erkannte Wörterkette wird unter Nutzung der Wörterkette als Abrufschlüssel in einen dem Wort entsprechenden Code umgewandelt und über ein öffentliches Tastennetz von einem DTMF-Generator an ein Sende-Empfangsgerät gesendet. Das Sende-Empfangsgerät empfängt den Code von einem DTMF-Empfänger, und ein dem Code entsprechendes Wort wird unter Nutzung des Codes als Abrufschlüssel aus der Vergleichstabelle in derselben Form wie der Vergleichstabelle des Stimmcodes abgerufen. Dadurch ist eine Funktionsfähigkeit erzielt, mit der der Sprecher mit dem Sende-Empfangsgerät kommunizieren kann, als ob er mit jemandem eine Unterhaltung führte, ungeachtet dessen, daß die betreffende Person nicht zur Stelle ist.

Es ist eine Aufgabe der Erfindung, ein neues Verfahren zum Steuern von Telekommunikationsdiensten bereitzustellen und dadurch die oben angeführten Nachteile zu beseitigen.

Das erfindungsgemäße Verfahren ist durch die Ausführungen in Anspruch 1 gekennzeichnet. Das erfindungsgemäße Endgerät ist durch die Ausführungen in Anspruch 5 gekennzeichnet. Bevorzugte Ausführungsformen der Erfindung sind in den Unteransprüchen beschrieben.

Die Erfindung betrifft ein Verfahren zum Steuern eines Telekommunikationsdiensts. Gemäß der Erfindung umfaßt das Verfahren folgende Schritte: Speichern eines Befehlsvokabulars durch Sprache sowie der elektrischen Steuersignale, die den Befehlswörtern entsprechen, in einem Endgerät, Wählen einer Telefonnummer und Verbinden eines Anrufs, Empfangen von Sprache von einem Benutzer in dem Endgerät, Erkennen eines Befehlsworts in der Sprache des Benutzers, Lesen eines Steuersignals, das dem Befehlswort entspricht, in dem Endgerät und Senden des aus dem Endgerät gelesenen Steuersignals zum Steuern des Telekommunikationsdiensts an das System.

Bei einer Anwendungsmöglichkeit der Erfindung wird das Befehlsvokabular und die entsprechenden Steuersignale in den folgenden Schritten gespeichert: das Endgerät wird in den Befehlsvokabulareingabezustand eingestellt, ein Befehlswort wird geäußert, ein Steuersignal wird in das Endgerät gespeist und das Befehlswort und das entsprechende Steuersignal wird gespeichert.

Bei einer Anwendungsmöglichkeit der Erfindung umfaßt das Steuersignal eine Mehrfrequenzverfahren-Codefolge (DTMF-Codefolge). Benutzer eines gewöhnlichen Mobiltelefons drücken Drucktasten, um beispielsweise Voice-Mail-Auswahlen zu treffen.

Bei einer Anwendungsmöglichkeit der Erfindung ist das Befehlsvokabular zumindest teilweise telekommunikationsdienstspezifisch. Telekommunikationsdienstspezifisch bedeutet hier, daß das Befehlswort ein anderes Steuersignal aufweisen kann, wenn ein anderer Telekommunikationsdienst genutzt ist. Dies kann zumindest durch zahlreiche verschiedene Befehlsvokabularien erzielt sein, die ein gleiches Wort umfassen, das mit verschiedenen Steuersignalen verknüpft ist.

Bei einer Anwendungsmöglichkeit der Erfindung ist ein Telekommunikationsdienst auf Grundlage der Telefonnummer definiert, die im Endgerät gewählt ist. Der Telekommunikationsdienst ist festgelegt, aus möglicherweise vielen mit dem Befehlswort verknüpften Steuersignalen ein Steuersignal auszusuchen, das für den Telekommunikationsdienst spezifisch ist.

Die Erfindung betrifft außerdem ein Endgerät. Gemäß der Erfindung umfaßt das Endgerät Mittel zum Empfangen von Sprache von dem Benutzer und Übertragen eines Steuersignals, das einem erkannten Befehlswort entspricht, Mittel zur Übertragung und zum Empfang zum Aufbauen einer Verbindung mit einem Telekommunikationsdienst, Übertragen des Steuersignals, das dem erkannten Befehlswort entspricht, und Empfangen von Bereitschaftsmeldungen von dem Telekommunikationsdienst, Mittel zum Abhören der Bereitschaftsmeldungen des Telekommunikationsdiensts und Mittel zum Eingeben von Information wie Steuersignalen und Telefonnummern, Spracherkennungsmittel zum Erkennen eines gesprochenen Befehlsworts, eine Steuereinheit zum Steuern des Endgeräts und ein Display zum Anzeigen von Ergebnissen.

In einer Ausführungsform der Erfindung ist das Spracherkennungsgerät unter Nutzung eines digitalen Signalprozessors und Speicherschaltungen verwirklicht.

In einer Ausführungsform der Erfindung ist das Mittel zum Empfangen von Sprache des Benutzers ein separates Mikrofon mit Freisprecheinrichtung. Das Endgerät weist für diesen Betriebsmodus ein separates Mikrofon und Lautsprecher zum Fernbedienen der Vorrichtung auf.

In einer Ausführungsform der Erfindung ist das Endgerät ein mobiles Kommunikationsgerät.

Ein Vorteil der Erfindung ist, daß es nicht notwendig ist, individuelle Nummernauswahlen einer Befehlsfolge abzurufen und zu sprechen oder einzugeben, die schwer erinnerlich sind, sondern es kann eine Reihe von mehreren Nummernauswahlen durch Äußern eines einzigen Worts, das der Befehlsfolge entspricht, aktiviert werden.

Ein anderer Vorteil der Erfindung ist die Spracherkennungszuverlässigkeit, nachdem der Benutzer mit seiner eigenen Stimme die Befehlswörter, die zum Aktivieren der Steuersignale genutzt sind, in das Spracherkennungsgerät eingegeben hat. Danach stimmen der Tonbezug, der in dem Befehlsvokabular gespeichert ist, und die Stimme des Benutzers so genau wie möglich überein.

Ein weiterer Vorteil der Erfindung ist, daß die Benutzung einer Tastatur während eines Gesprächs vermieden sein kann. Dies ist bei einem Mobiltelefon vorzuziehen, da die Benutzung der Tastatur während eines Anrufs bei einem Mobiltelefon besonders schwierig ist.

Die Erfindung wird detaillierter unter Bezugnahme auf die beiliegenden Zeichnungen beschrieben.

Es zeigen:

1 in Form eines Ablaufdiagramms das Speichern eines Befehlsvokabulars in einem Endgerät gemäß der Erfindung;

2 in Form eines Ablaufdiagramms ein Verfahren gemäß der Erfindung; und

3 in Form eines Blockdiagramms wesentliche Elemente eines mobilen Kommunikationsgeräts gemäß der Erfindung.

1 stellt in Form eines Ablaufdiagramms ein Verfahren gemäß der Erfindung zum Speichern eines Befehlsvokabulars in einem Endgerät dar. Der Benutzer wählt den Befehlsvokabulareingabezustand mithilfe von Drucktasten 11 und wählt 12 die Nummer des Telekommunikationsdiensts, dem das betreffende Befehlsvokabular zugeordnet ist. Es wird dem Endgerät ein Befehlswort 13 gesagt und dann eine Drucktastenfolge 14, die dem Befehlswort entspricht, zum Erzeugen eines Steuersignals eingegeben. Es wird überprüft, ob alle Wörter des Befehlsvokabulars eingegeben wurden 15, wonach entweder die Eingabe beendet und die Dateneingabe gespeichert wird 16 oder die Eingabe des nächsten Befehlsworts begonnen wird.

2 stellt in Form eines Ablaufdiagramms ein Verfahren gemäß der Erfindung dar. Der Benutzer wählt zunächst eine Telefonnummer 21, und das Mobiltelefon wählt das Vokabular aus, das dieser Nummer zugeordnet ist. Die Telefonnummer ist beispielsweise die eines Bankdiensts, und ein Befehlsvokabular, das für Bankdienste optimiert ist, ist ihr in dem Endgerät zugeordnet. Als nächstes wird überprüft, ob die Verbindung hergestellt ist 23, d.h. ob der Anrufversuch durchgeschaltet wurde und ob der Dienst den Anruf angenommen hat. Wenn die Verbindung hergestellt ist, geht der Vorgang zum nächsten Zustand weiter, und wenn nicht, endet er. Im nächsten Schritt 24 wird geprüft, ob der Benutzer ein Wort geäußert hat, wobei der Vorgang im zutreffenden Fall zum Erkennen des Worts 25 übergeht und im gegenteiligen Fall zu Schritt 23 zurückkehrt. Wenn ein Wort erkannt wird 25, wird es mit Befehlswörtern verglichen, die in der Vorrichtung gespeichert sind, wie etwa „Konten". Auf Grundlage des Vergleichs verzweigt sich der Vorgang folgendermaßen: wenn das Wort kein Befehlswort ist, kehrt der Vorgang zu Schritt 23 zurück, wenn es jedoch ein Befehlswort ist, wird das entsprechende Steuersignal 27 in dem Endgerät gelesen.

Wenn das Steuersignal gelesen wurde 27, wird ein Steuersignal 28, das dem Befehlswort entspricht, an den Telekommunikationsdienst, in diesem Fall den Bankdienst, gesendet, wobei das Steuersignal vorzugsweise eine Reihe von Tönen ist, die aus DTMF-Tönen gebildet sind. Dann kehrt der Vorgang zu Schritt 23 zurück, um das nächste Befehlswort, Beginn des Diensts oder Trennen der Verbindung zu erwarten.

3 zeigt wesentliche Elemente eines mobilen Kommunikationsgeräts gemäß der Erfindung. Das mobile Kommunikationsgerät umfaßt auf der Übertragungsseite ein Mikrofon 31, Mikrofonverstärker 32 und ein Senderteil 33. Gemeinsame Teile zu Übertragung und Empfang beinhalten einen Duplexschalter 34 und eine Antenne 35. Auf der Empfangsseite umfaßt das mobile Kommunikationsgerät ein Empfängerteil 36, Hörerverstärker 37 und einen Hörer 38. Zudem beinhaltet das mobile Kommunikationsgerät eine Tastatur 39, Spracherkennungsgerät 40, Steuerteil 41 und ein Display 42. Während der Unterweisungsphase des Spracherkennungsgeräts 40 oder während der Spracherkennung wird unter Steuerung des Steuerteils 41 Klang vom Mikrofon 31 zum Spracherkennungsgerät 40 geleitet. Anstelle des Mikrofons 31 des Mobiltelefons kann ein Mikrofon mit Freisprecheinrichtung genutzt sein. Das Spracherkennungsgerät 40, das an sich bekannt ist, ist typischerweise unter Nutzung im wesentlichen eines digitalen Signalprozessors (DSP) und Speicherschaltungen verwirklicht.

Als Beispiel wird ein Fall betrachtet, in dem eine Dienstnummer angerufen wird, für die aufeinanderfolgende DTMF-Töne erzeugt werden müssen, um eine gegebene Funktion zu aktivieren. Eine derartige Dienstnummer ist eine Sprachmailbox, die von GSM-Betreibern angeboten ist (GSM = Global System for Mobile Communications). Eine Sprachmailbox wird zum Anrufen einer Dienstnummer und Eingeben von Nummernfolgen genutzt, die als DTMF-Töne übertragen werden. Die Nummernfolgen werden zum Eingeben eines Paßworts und Auswählen einer gewünschten Funktion in der logischen Baumstruktur des Diensts genutzt. Bei Nutzung des Verfahrens gemäß der Erfindung erkennt das Endgerät, in diesem Falle das mobile Kommunikationsgerät, die Dienstnummer als eine Sprachmailboxnummer und aktiviert das ihr zugeordnete Befehlsvokabular. Wenn der Anruf eingerichtet ist, äußert der Benutzer ein Befehlswort, das der gewünschten Funktion entspricht und das in dem Spracherkennungsgerät des mobilen Kommunikationsgeräts erkannt und in dem Vokabular zu finden ist. In dem Vokabular entspricht ein Steuersignal dem Befehlswort, und DTMF-Töne gemäß dem Steuersignal werden an die Sprachmailbox gesendet, genau wie der Benutzer die Nummernfolge durch Drücken individueller Drucktasten eingeben würde. Somit ist eine Funktion einer Sprachmailbox oder dergleichen, die eine lange und schwer erinnerliche Befehlsfolge erfordert, leicht durch Äußern eines Befehlsworts des passenden Vokabulars gestartet, an das sich der Benutzer leicht erinnern kann. Solche Wörter, die zu erkennen sind, sind beispielsweise „zurück", „weiter", „warten" usw.

Ein telekommunikationsdienstspezifisches Vokabular ist beispielsweise folgendermaßen: Befehlswort Steuersignal Paßwort 1234 Abhören #1 Weiter #2 Zurück #3
Speichern #4 Löschen #5

Das Vokabular wird vorzugsweise wie oben beschrieben vom Benutzer in dem mobilen Kommunikationsgerät gespeichert; alternativ lädt der Benutzer das Vokabular, das dem Dienst entspricht, über eine Infrarotverbindung (IR-Verbindung) oder Kommunikationsschnittstelle herunter.

Die Erfindung kann bei einem mobilen Kommunikationsgerät Anwendung finden, das kein Display oder sogar keine Tastatur aufweist. Ein mobiles Kommunikationsgerät ohne Tastatur würde lediglich durch die Stimme gesteuert.

Ein Steuersignal kann auch aus Signalen gebildet sein, die keine DTMF-Töne sind. Derartige Signale können beispielsweise Merkmalsvektoren sein, die bei dem Spracherkennungsvorgang erzeugt werden.


Anspruch[de]
  1. Verfahren zur Steuerung eines Telekommunikationsdiensts, folgende Schritte umfassend:

    – Wählen einer Telefonnummer eines Telekommunikationsdiensts (21) und Verbinden eines Anrufs,

    – Empfangen von Sprache von einem Benutzer (24) in einem Endgerät,

    – Erkennen (25) eines Befehlsworts (26) in dem Endgerät aus der Sprache des Benutzers,

    – Lesen (27) eines Steuersignals, das dem Befehlswort (26) entspricht, in dem Endgerät,

    – Senden (28) des Steuersignals, das aus dem Endgerät gelesen wurde, an den Telekommunikationsdienst zur Steuerung des Telekommunikationsdiensts, dadurch gekennzeichnet, daß das Verfahren außerdem folgende Schritte umfaßt:

    – Speichern (16), in einem Vokabulareingabezustand, eines Befehlsvokabulars durch Sprache (13) und elektrischer Steuersignale (14), die Befehlswörtern entsprechen, in dem Endgerät,

    – Auswählen (22) des spezifischen Befehlsvokabulars, das der gewählten Telefonnummer des Telekommunikationsdiensts zugeordnet ist.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Befehlsvokabular und entsprechende Steuersignale in den folgenden Schritten gespeichert werden:

    – Einstellen (11) des Endgeräts in den Befehlsvokabulareingabezustand,

    – Äußern (13) eines Befehlsworts,

    – Einspeisen (14) eines Steuersignals in das Endgerät und

    – Speichern (16) des Befehlsworts und des entsprechenden Steuersignals.
  3. Verfahren nach einem der Ansprüche 1 oder 2, dadurch gekennzeichnet, daß das Steuersignal eine DTMF-Codefolge umfaßt.
  4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß der Telekommunikationsdienst auf einer Grundlage einer Telefonnummer, die auf dem Endgerät gewählt wird, festgelegt ist.
  5. Telekommunikationsendgerät, umfassend:

    – Mittel (31, 32, 33) zum Empfangen von Sprache von einem Benutzer und Übertragen eines Steuersignals, das einem erkannten Befehlswort entspricht,

    – Mittel (34, 35) zur Übertragung und zum Empfang zum Aufbauen einer Verbindung mit einem Telekommunikationsdienst, Übertragen des Steuersignals, das dem erkannten Befehlswort entspricht, und Empfangen von Bereitschaftsmeldungen von dem Telekommunikationsdienst,

    – Mittel (36, 37, 38) zum Abhören von Bereitschaftsmeldungen des Telekommunikationsdiensts,

    – Mittel (39) zum Eingeben von Information wie Steuersignalen und Telefonnummern, Spracherkennungsmittel (40) zum Erkennen eines gesprochenen Befehlsworts, eine Steuereinheit (41) zum Steuern des Endgeräts und ein Display (42) zum Anzeigen von Ergebnissen, dadurch gekennzeichnet, daß das Telekommunikationsendgerät außerdem Mittel, die zum Speichern eines Befehlsvokabulars, in einem Vokabulareingabezustand, durch Sprache (13) und elektrischer Steuersignale (14), die Befehlswörtern entsprechen, in dem Telekommunikationsgerät angeordnet sind, und Mittel, die zum Auswählen (22) des spezifischen Befehlsvokabulars, das dem verbundenen Telekommunikationsdienst zugeordnet ist, angeordnet sind, umfaßt.
  6. Telekommunikationsendgerät von Anspruch 5, dadurch gekennzeichnet, daß das Spracherkennungsgerät (40) unter Nutzung eines digitalen Signalprozessors und Speicherschaltungen verwirklicht ist.
  7. Telekommunikationsendgerät von Anspruch 5, dadurch gekennzeichnet, daß das Mittel (31) zum Empfangen von Sprache von dem Benutzer ein separates Mikrofon mit Freisprecheinrichtung ist.
  8. Telekommunikationsendgerät nach einem der vorhergehenden Ansprüche 5 bis 7, dadurch gekennzeichnet, daß das Telekommunikationsendgerät ein mobiles Kommunikationsgerät ist.
Es folgen 3 Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com