PatentDe  


Dokumentenidentifikation DE69832003T2 13.07.2006
EP-Veröffentlichungsnummer 0000877518
Titel Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle und ein durch Sprachbefehle gesteuertes Telekommunikationsendgerät
Anmelder Nokia Corp., Espoo, FI
Erfinder Laurila, Kari, 33720 Tampere, FI;
Mettälä, Markku, 33820 Tampere, FI
Vertreter COHAUSZ & FLORACK, 40211 Düsseldorf
DE-Aktenzeichen 69832003
Vertragsstaaten DE, FR, GB, IT
Sprache des Dokument EN
EP-Anmeldetag 28.04.1998
EP-Aktenzeichen 981076748
EP-Offenlegungsdatum 11.11.1998
EP date of grant 26.10.2005
Veröffentlichungstag im Patentblatt 13.07.2006
IPC-Hauptklasse H04M 1/27(2006.01)A, F, I, 20051017, B, H, EP

Beschreibung[de]

Die vorliegende Erfindung betrifft ein Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle, das im Oberbegriff des anhängigen Patentanspruchs 1 dargelegt wird. Ferner betrifft die Erfindung ein Telekommunikationsendgerät, das im Oberbegriff des anhängigen Patentanspruchs 4 dargelegt wird.

Eine Telefonnummer wird für gewöhnlich durch Verwenden einer Wählscheibe oder von Wähltasten eines Telekommunikationsendgeräts gewählt. Es gibt jedoch Situationen, in welchen es notwendig wäre, eine Telefonnummer z.B. durch Sprechen der Telefonnummer zu wählen. Insbesondere zur Verwendung in Kraftfahrzeugen wurden so genannte Freisprechbetriebsarten entwickelt, wobei der Fahrer des Fahrzeugs das Steuerrad zum Wählen der Telefonnummer nicht loslassen muss. Das Wählen der Telefonnummer erfolgt demnach durch Sagen der zu wählenden Telefonnummer. Diese Art von Freisprechbetrieb ist z.B. auch für Büros praktisch. In der einfachsten Form funktioniert diese Art des Wählens der Telefonnummer durch Sprachbefehle derart, dass der Benutzer des Telekommunikationsendgeräts die Telefonnummer Ziffer für Ziffer sagt, wobei nach dem Sagen der ganzen Nummer eine Spracherkennungseinheit im Telekommunikationsendgerät die Zahlenfolge sucht, welche die Spracherkennungseinheit als jene interpretiert, die der durch den Benutzer angesagten Zahlenfolge am besten entspricht. Die Interpretation basiert z.B. auf der Tatsache, dass die Spracherkennungseinheit einen oder mehrere Merkmalsvektoren auf der Basis des empfangenen Audiosignals berechnet. Der Sprachmusterspeicher der Spracherkennungseinheit enthält z.B. Sprachmuster, welche numerischen Ziffern entsprechen, und diese werden zusammen mit den aus dem Audiosignal berechneten Merkmalsvektoren zum Berechnen des Erkennungsergebnisses durch Verwenden von an sich bekannten Verfahren verwendet.

Telefonnummern sind für gewöhnlich sehr lang, üblicherweise Zahlenfolgen mit wenigstens sieben numerischen Ziffern, wobei die Anzahl von verschiedenen Kombinationen sehr groß ist: Bei einer Folge von sieben Zahlzeichen gibt es 10.000.000 alternative Kombinationen. Wenn Anrufe an Mobilstationen, an Telekommunikationsendgeräte verschiedener Verzeichnisbereiche oder von einem Land in ein anderes getätigt werden, kann die Länge der Telefonnummer bis zu 15 numerische Ziffern lang sein. Die große Anzahl von alternativen Kombinationen stellt hohe Ansprüche an den Betrieb eines durch Sprachbefehle zu steuernden Geräts, um die Anzahl von falschen Erkennungen auf ein Minimum herabsetzen zu können. In der zuvor erwähnten Situation des Wählens einer Telefonnummer, die aus sieben numerischen Ziffern besteht, führt die falsche Erkennung selbst einer numerischen Ziffer zu einer falschen Wahl.

Das US-Patent Nr. 4,870,686 offenbart ein Telekommunikationsendgerät, das durch Spracherkennung gesteuert wird, wobei die zu wählende Telefonnummer in einer oder mehreren Ziffernketten geäußert werden kann. Jede Ziffernkette wird getrennt erkannt, wobei die Anzahl von Alternativen für jede Ziffernkette erheblich niedriger ist als in einer Situation, in der die ganze Telefonnummer als eine Ziffernkette erkannt wird. Zum Beispiel kann die Telefonnummer „1234567" demnach z.B. in den Ziffernketten „12", „34" und „567" geäußert werden, wobei die Anzahl von verschiedenen Wählalternativen einhundert für die erste und die zweite Ziffernkette und eintausend für die dritte Ziffernkette beträgt. Somit ist die Wahrscheinlichkeit, dass jede Ziffernkette richtig erkannt wird, beträchtlich höher, als wenn die ganze Telefonnummer als eine Zahlenfolge erkannt werden würde. Allerdings weist auch dieses Wählverfahren den Nachteil auf, dass, wenn irgendeine der Ziffernketten beim ersten Mal falsch erkannt wird, in welchem Fall der Benutzer die Spracherkennungseinheit steuert, um diese Zahlzeichenfolge erneut zu erkennen, die Spracherkennungseinheit dieselbe falsche Interpretation möglicherweise auch beim nächsten Mal macht. Im schlimmsten Fall muss der Benutzer die ganze Zahlenfolge wiederholen, und selbst dies gewährleistet nicht, dass die Spracherkennungseinheit die geäußerte Telefonnummer richtig erkennen kann. Die Unzuverlässigkeit der Erkennung ist auf eine Anzahl von verschiedenen Faktoren zurückzuführen. Zum Beispiel kann die Erkennung der Telefonnummer durch Rauschbedingungen gestört werden. Außerdem werden viele Erkennungseinheiten auf der Herstellungsstufe vorteilhafterweise so programmiert, dass ein durchschnittliches Sprachmuster für jede Zahl von Null bis Neun im Sprachmusterspeicher der Erkennungseinheit gespeichert wird. Verschiedene Benutzer sprechen die Zahlen jedoch auf eine etwas unterschiedliche Art und Weise aus, was nicht unbedingt immer zu einer gleich guten Erkennung für verschiedene Benutzer führt, wobei die Fehlerrate unterschiedlich sein kann, wenn verschiedene Personen solch ein Telekommunikationsendgerät verwenden, das durch Sprachbefehle gesteuert wird. In diesen Situationen ist es möglich, Erkennungseinheiten zu verwenden, welche gelehrt werden können, die Stimme des Benutzers zu erkennen, d.h. der Benutzer spricht die Zahlen von Null bis Neun aus, wobei die Spracherkennungseinheit die Sprachmuster, welche den Zahlen im Sprachmusterspeicher entsprechen, speichert. Trotzdem schaltet auch dies nicht alle falschen Erkennungen, z.B. unter dem Einfluss von Rauschen oder der Stimme des Benutzers, die aus irgendeinem Grund anders ist, aus.

Ferner wurden solche sprachgesteuerten Telekommunikationsendgeräte entwickelt, in welchen der Benutzer die gewünschten Telefonnummern und eine Identifikation, die diesen entspricht, wie beispielsweise den Namen einer Firma und/oder einer Person, speichern kann. Demnach kann die Auswahl der Telefonnummer durch Äußern der Identifikation erfolgen, auf deren Basis die Spracherkennungseinheit die gespeicherten Identifikationen vergleicht und das Wählen auf der Basis dieses Vergleichs ausführt. In solch einem Gerät, in welchem die Identifikation in Teilidentifikationen unterteilt werden kann, führt die Erkennungseinheit einen Vergleich von Teilidentifikationen durch, und nach der richtigen Erkennung der Teilidentifikation äußert der Benutzer die nächste Teilidentifikation. Wenn eine genügende Anzahl von Teilidentifikationen geäußert wurde, um die Telefonnummer zu identifizieren, führt das Telekommunikationsendgerät das Wählen der Telefonnummer aus. Auch bei dieser Art eines Telekommunikationsendgeräts kann das Problem auftreten, dass die Identifikation oder Teilidentifikation ständig falsch erkannt wird und die richtige Telefonnummer nicht gewählt werden kann.

Das Patent US-5,577,164 offenbart ein Verfahren und eine Vorrichtung zur Verarbeitung der Verhinderung und Wiederherstellung von falschen Sprachbefehlserkennungen. Informationen zum Identifizieren, ob ein Wort im reinen Erkennungsvorgang erkannt werden sollte, werden in einem Erkennungswörterbuch gespeichert. Diese Informationen werden jedes Mal, wenn das erkannte Ergebnis erhalten wird, aktualisiert, um das Wort für die nächste Erkennung zu aktualisieren und es möglich zu machen, zu verhindern, dass eine falsche Erkennung wiederholt wird. Eine Anzeige dessen, ob jedes Wort wiederholt eingegeben werden kann, wird als Identifikationsinformation im Erkennungswörterbuch gespeichert. Wenn das erkannte Wort ein Wort ist, das nicht wiederholt eingegeben werden kann, wird die Identifikationsinformation des Wortes aktualisiert.

Ein Spracherkennungsabschnitt des Geräts führt bei Spracheingabe über den Spracheingabeabschnitt eine Sprachtonerkennung durch. Der Spracherkennungsabschnitt vergleicht die digitalen Sprachsignale, die durch den Spracheingabeabschnitt aufgenommen werden, mit dem Sprachmuster für jedes Wort, das im Erkennungswörterbuch gespeichert ist und gibt Informationen im Wörterbuch über das Wort mit der größten Ähnlichkeit aus. Wenn ein Erkennungsfehler erfasst wird, oder wenn dasselbe Wort zweimal erkannt wird, obwohl das Wort nicht wiederholt werden kann, wird das erkannte Wort als nicht verwendbar markiert. Wenn zum Beispiel der Befehl „einschalten" erkannt wird, obwohl das Gerät bereits eingeschaltet ist, wird ein Fehler angezeigt.

Nach einer falschen Erkennung werden dem Benutzer jene Zahlen, die bereits richtig erkannt sind, nicht angezeigt.

Die Patentanmeldung EP 0 307 193 offenbart einen Telefonapparat, in welchem ein Anruf als Reaktion auf Äußerungen von Bedienern ohne manuelles Wählen mithilfe einer Spracherkennungsfunktion getätigt werden kann. Die Spracherkennung erfolgt durch Erzeugen eines Sprachmusters aus dem geäußerten Sprachsignal und Vergleichen desselben mit gespeicherten Sprachmustern. Jenes gespeicherte Sprachmuster, das den geringsten Unterschied ergibt, wird ausgewählt, um das geäußerte Wort darzustellen, wenn der Unterschied gering genug ist. Wenn der Unterschied innerhalb einer vorgegebenen Grenze ist, ist das jeweilige Wort das Ergebnis der Spracherkennung. Andernfalls wird ein Erkennungsfehler signalisiert. Die Fehlererkennungssignalisierung zeigt nur an, dass die Erkennung nicht erfolgreich war.

Ein Zweck der vorliegenden Erfindung ist es, die zuvor erwähnten Nachteile in einem großen Maß auszuschalten und ein so genaues Wählen einer Telefonnummer durch Sprachbefehle als möglich bereitzustellen. Die Erfindung basiert auf der Idee, dass, wenn der Benutzer eine Telefonnummer, einen Teil der Telefonnummer oder eine Identifikation äußert, nach einer falschen Erkennung diese Erkennung durch die Erkennungseinheit als falsch markiert wird, wobei, wenn der Benutzer die Zahlenfolge oder die Identifikation wiederholt, die Erkennungseinheit nicht mehr die erkannte falsche Alternative, sondern die Alternative anbietet, welche gemäß der Berechnung durch die Erkennungseinheit die nächstwahrscheinliche ist und welche nicht als falsch markiert ist. Auf diese Weise wird die Anzahl von alternativen Kombinationen nach jeder falschen Erkennung verringert, wobei die richtige Zahlenfolge oder Identifikation spätestens dann erstellt wird, wenn nur eine einzige Alternative bleibt. Das Verfahren gemäß der vorliegenden Erfindung ist durch das gekennzeichnet, was im kennzeichnenden Teil des anhängigen Patentanspruchs 1 dargelegt wird. Ferner ist das Telekommunikationsendgerät gemäß der vorliegenden Erfindung durch das gekennzeichnet, was im kennzeichnenden Teil des anhängigen Patentanspruchs 4 dargelegt wird.

Die vorliegende Erfindung liefert bedeutende Vorteile. Durch Verwenden des Verfahrens der Erfindung kann der Betrieb von sprachgesteuerten Telekommunikationsendgeräten z.B. aus dem Grund, dass die Erkennungseinheit nach einer falschen Erkennung nicht dieselbe Alternative anbietet, in erheblichem Maße verbessert werden. Auch bei Störbedingungen ist das Telekommunikationsendgerät der Erfindung zuverlässiger als sprachgesteuerte Telekommunikationsendgeräte des Standes der Technik. Außerdem verbessert das Verfahren der Erfindung den Betrieb solcher Telekommunikationsendgeräte, in welchen die Spracherkennungseinheit keine so genannte „lernfähige" Erkennungseinheit ist, sondern in welcher die Erkennung auf einem durchschnittlichen Sprachmuster basiert.

Im Folgenden wird die Erfindung unter Bezugnahme auf die angehängten Zeichnungen ausführlicher beschrieben, wobei

1 ein reduziertes Blockdiagramm eines Telekommunikationsendgeräts gemäß einer vorteilhaften Ausführungsform der Erfindung ist;

2 eine Tabelle ist, welche die Funktionsweise des Verfahrens gemäß der ersten vorteilhaften Ausführungsform der Erfindung mit der Funktionsweise des Verfahrens gemäß dem Stand der Technik vergleicht;

3 eine Tabelle ist, welche die Funktionsweise des Verfahrens gemäß der zweiten vorteilhaften Ausführungsform der Erfindung mit der Funktionsweise des Verfahrens gemäß dem Stand der Technik vergleicht.

Die Funktionsweise des Verfahrens gemäß der Erfindung wird in einem sprachgesteuerten Telekommunikationsendgerät von 1 beschrieben, in welchem das Wählen der Telefonnummer durch Sprachbefehle durch Äußern der zu wählenden Telefonnummer entweder als eine einzige Zahlenfolge oder in zwei oder mehr Zahlenketten geteilt ausgeführt werden kann. Das Telekommunikationsendgerät 1 kann jedes Telekommunikationsendgerät, wie beispielsweise ein Festnetztelekommunikationsendgerät oder ein drahtloses Telekommunikationsendgerät, z.B. eine GSM-Mobilstation, sein. In dieser vorteilhaften Ausführungsform umfasst das Telekommunikationsendgerät 1 eine Benutzerschnittstelle mit einem Mikrofon 2a, einem Kopfhörer 3a, einer Anzeige 4 und einer Tastatur 5. Das elektrische Signal, das durch das Mikrofon 2a erzeugt wird, wird in einem Mikrofonverstärker 6 verstärkt und in einem Sprachbefehlszustand zu einer Erkennungseinheit 7 geleitet. Auf eine entsprechende Weise wird das Audiosignal, das durch die Erkennungseinheit 7 erzeugt wird, in einem Kopfhörerverstärker 13 verstärkt und zum Kopfhörer 3a geleitet. Die Erkennungseinheit 7 weist eine Steuereinheit 14, welche z.B. ein Digitalsignalprozessor DSP ist, einen Sprachmusterspeicher 8 und einen Programmspeicher 9 auf. Der Sprachmusterspeicher 8 ist vorteilhafterweise ein nichtflüchtiger Direktzugriffsspeicher NVRAM (für engl. non-volatile random access memory). Der Programmspeicher 9 ist vorzugsweise ein Nur-Lese-Speicher (ROM für engl. read-only memory) oder ein nichtflüchtiger Direktzugriffsspeicher (RAM). Ferner weist die Erkennungseinheit 7 einen Direktzugriffsspeicher (RAM) 10 zum Speichern von Daten während der Verwendung des Geräts auf. Es ist zu erwähnen, dass der Sprachmusterspeicher 8 und der Programmspeicher 9 auch so genannte FLASH-Speicher sein können, wie für einen Fachmann zu erkennen ist.

Signale werden zwischen der Erkennungseinheit 7 und dem Telekommunikationsendgerät 1 z.B. über ein Anpassungsnetz 15 zum Puffern und Verstärken von Signalen, falls nötig, übertragen.

Die Benutzersprachschnittstelle des Telekommunikationsendgeräts 1 der Erfindung ist vorzugsweise eine Zweiwegbenutzerschnittstelle, d.h. dem Telekommunikationsendgerät 1 können Sprachbefehle eingegeben werden, und das Telekommunikationsendgerät 1 kann entweder durch Sprachansagen und/oder über eine Anzeigeeinheit 4 Antworten auf die Befehle erzeugen. Die Sprachansagen können vorteilhafterweise mit einem Sprachsynthesizer 12 oder durch einen Digitalsignalprozessor DSP erzeugt werden, wobei die Sprachansagen z.B. im Programmspeicher 9 der Erkennungseinheit 7 im Voraus gespeichert werden. Die Speicherkapazität, die durch die Sprachansagen benötigt wird, kann durch Speichern von Sprachansagen unter Verwendung eines an sich bekannten Sprachcodierungsverfahren verringert werden.

Außerdem weist das Telekommunikationsendgerät 1 von 1 eine Steuereinheit 18 zum Steuern des Betriebs des Telekommunikationsendgeräts und ein Verbindungsteil 11 auf. Das Verbindungsteil ist eines gemäß dem Stand der Technik zum Verbinden des Telekommunikationsgeräts 1 mit einem Telekommunikationsnetz (nicht dargestellt). Das Verbindungsteil 11 ist zum Beispiel in einer GSM-Mobilstation ein Funkteil, das vorteilhafterweise einen Sender TX, einen Empfänger RX, einen Antennenschalter SW und eine Antenne ANT umfasst. Das Telekommunikationsendgerät 1 von 1 kann auch als ein herkömmliches Telekommunikationsendgerät verwendet werden, wobei das Wählen der Telefonnummer durch Verwenden der Tastatur 5 ausgeführt wird. Das Mikrofon 2 und der Kopfhörer 3 können zum Beispiel das Mikrofon 2b und der Kopfhörer 3b der Freisprechanlage 17 oder das Mikrofon 2a und der Kopfhörer 3a des Telefonteils sein.

Das Umschalten des Telekommunikationsendgeräts 1 auf eine Betriebsart zur Steuerung durch Sprachbefehle erfolgt auf eine an sich bekannte Art und Weise, nämlich zum Beispiel durch die Menüfunktionen des Telekommunikationsendgeräts 1, oder auf eine Art und Weise, dass das Telekommunikationsendgerät 1 an die Freisprechanlage 17 mit einem Schalter 16 zum Aktivieren des Sprachbefehlbetriebs angeschlossen wird. Wenn das Telekommunikationsendgerät 1 in der sprachgesteuerten Betriebsart ist, werden Audiosignale über das Mikrofon 2a oder das Zusatzmikrofon 2b empfangen, im Mikrofonverstärker 6 verstärkt und zur Erkennungseinheit 7 geleitet. Auf der Basis des empfangenen Audiosignals berechnet die Erkennungseinheit 7 den entsprechenden einen oder die entsprechenden mehreren Merkmalsvektoren, welche durch die Erkennungseinheit 7 verarbeitet werden, um herauszufinden, welcher Befehl oder welche Nummer vom Benutzer geäußert wurde. Dies erfolgt auf eine an sich bekannte Art und Weise, nämlich zum Beispiel durch Vergleichen des berechneten Merkmalsvektors mit den Sprachmustern, die im Sprachmusterspeicher 8 gespeichert sind. Der Sprachmusterspeicher 8 enthält auch Sprachmuster, welche verschiedenen Befehlen entsprechen. Für jeden zu erkennenden Befehl erzeugt die Erkennungseinheit 7 vorteilhafterweise mehrere mögliche Alternativen und ihre Reihenfolge nach der Wahrscheinlichkeit, wobei der erste Vorschlag die Alternative ist, für welche die Erkennungseinheit 7 die größte Wahrscheinlichkeit berechnet hat.

Das Wählen der Telefonnummer wird zum Beispiel durch das Äußern des Befehls „SELECT NUMBER" (Nummer Auswählen) begonnen. Danach erzeugt die Erkennungseinheit 7 die Meldung „GIVE NUMBER" (Nummer Eingeben) auf der Anzeige oder erzeugt eine entsprechende Tonmeldung im Kopfhörer 3a, 3b. Ein Vorteil der Tonmeldung ist, dass der Benutzer seine Augen nicht auf das Anzeigemittel 4 zu richten braucht, was in einigen Situationen schwierig sein könnte. Danach äußert der Benutzer die gewünschte Telfonnummer entweder als eine einzige Zahlenfolge oder als zwei oder mehr Zahlenketten. Als ein Beispiel wird die Telefonnummer „1234567" verwendet, welche durch den Benutzer in drei Zahlenketten, nämlich „12", „34" und „567", geäußert wird. Der Benutzer beginnt mit dem Äußern der Zahlenkette „12". Danach führt die Erkennungseinheit 7 einen Vergleich mit den Daten im Sprachmusterspeicher durch und schlussfolgert zum Beispiel, dass der Benutzer die Zahlenkette „98" geäußert hat. Die Erkennungseinheit 7 erzeugt diese erkannte Zahlenkette „98" für das Anzeigemittel 4 und/oder als eine Tonmeldung für den Kopfhörer 2a, 2b. Der Benutzer merkt, dass die Wahl falsch war, wobei der Benutzer auf eine an sich bekannte Art und Weise zum Beispiel den Befehl „ERROR" (Fehler) äußert. Daraufhin markiert die Erkennungseinheit 7 diese Zahlenkette als falsch, wiederholt möglicherweise die bereits richtig erkannten Zahlenketten (wenn bereits welche erkannt wurden) als eine Tonmeldung im Kopfhörer 3 und/oder als Textmeldung auf dem Anzeigemittel 4 und wartet auf die Zahlenkette, die vom Benutzer erneut geäußert werden soll. Aus dieser Wiederholung des richtig erkannten Teils der Telefonnummer kann der Benutzer schlussfolgern, dass die Erkennungseinheit den „ERROR"-Befehl richtig erkannt hat, d.h. es ist eine Art von Bestätigungsmeldung für den Benutzer. Nachdem der Benutzer die Zahlenkette erneut geäußert hat, führt die Erkennungseinheit 7 mit dem Unterschied, dass sie die Zahlenkette „98", die sich als falsch herausgestellt hatte, ignoriert, eine neue Erkennung durch. Als Nächstes schlägt die Erkennungseinheit 7 eine neue Zahlenkette vor. Wenn die Erkennung nun richtig ist, äußert der Benutzer die nächste Zahlenkette, welche wieder durch die Erkennungseinheit 7 erkannt wird. Wenn die Erkennung wieder falsch ist, wird die Wahl als falsch markiert, der richtig erkannte Teil der Telefonnummer wird wiederholt, und es wird eine neue Erkennung durchgeführt. Wenn weiter auf diese Weise vorgegangen wird, wird schließlich die ganze Telefonnummer zum Wählen richtig erkannt. Das Wählen der Nummer erfolgt zum Beispiel durch Äußern des Befehls „DIAL" (Wählen). Danach wird die Operation auf eine an sich bekannte Art und Weise durch einen Rufaufbau, der in diesem Zusammenhang nicht näher erörtert werden muss, fortgesetzt.

In einer Fehlersituation kann die Erkennungseinheit 7 auch auf eine Art und Weise funktionieren, dass die Erkennungseinheit 7 als Reaktion auf den „ERROR"-Befehl oder dergleichen die Meldung „CORRRECTION" (Korrektur) erzeugt und erst danach die richtig erkannten Zahlenketten wiederholt. In einigen Situationen macht es diese „CORRECTION"-Meldung für den Benutzer leichter, zu bemerken, dass die Erkennungseinheit 7 den „ERROR"-Befehl richtig erkannt hat.

Es ist möglich, dass der Benutzer vor dem Rufaufbau zu bestätigen wünscht, dass die durch die Erkennungseinheit erkannte Nummer wirklich richtig ist. Dies kann z.B. durch Äußern des Befehls „CONFIRM" (Bestätigen) geschehen, woraufhin die Erkennungseinheit die Telefonnummer vorteilhafterweise als Tonmeldung wiederholt und den Benutzer gleichzeitig auch fragt, ob er wünscht, einen Ruf aufzubauen. Wenn die Nummer richtig ist und der Benutzer danach wünscht, einen Ruf aufzubauen, äußert er den Befehl „DIAL" (Wählen), wie bereits erwähnt. Andernfalls wird kein Ruf aufgebaut.

Folglich erzeugt die Erkennungseinheit 7 der Erfindung wenigstens eine Wählalternative für jede geäußerte Zahlenkette. Die Erkennungseinheit 7 kann auch auf eine Art und Weise funktionieren, dass sie mehrere alternative Zahlenketten erzeugt, für welche sie einen Wahrscheinlichkeitswert berechnet. Demnach ist die erste Auswahl die Zahlenkette mit dem höchsten Wahrscheinlichkeitswert. Wenn die Auswahl falsch ist, braucht der Benutzer die Zahlenkette nicht notwendigerweise zu wiederholen, sondern der Benutzer kann stattdessen den Befehl „NEXT" (Nächste) äußern, woraufhin die Erkennungseinheit 7 die Zahlenkette mit dem nächsthöchsten Wahrscheinlichkeitswert vorschlägt. Wenn auch dieser falsch ist, wird wieder der nächste vorgeschlagen und so weiter, bis alle Zahlenketten, für welche ein Wahrscheinlichkeitswert berechnet wurde, durchgegangen wurden, oder bis die richtige Zahlenkette gefunden wurde. Wenn keine der Zahlenketten der vom Benutzer geäußerten Zahlenkette entspricht, fordert die Erkennungseinheit 7 den Benutzer auf, die Zahlenkette erneut zu äußern. In diesem Fall schlägt die Erkennungseinheit 7 die Zahlenketten, die sich in der vorhergehenden Phase als falsch herausstellten, nicht mehr vor.

Zur Realisierung des Verfahrens gemäß der Erfindung ist der Datenspeicher 10 der Erkennungseinheit 7 zum Beispiel mit einer Tabelle versehen, in welcher die Erkennungswerte einer geäußerten Zahlenkette gespeichert sind. Ein vorteilhaftes Beispiel ist in Tabelle 1 gezeigt. Hier hat der Benutzer die Zahlenkette „12" geäußert. Die Erkennungseinheit 7 hat die Wahrscheinlichkeitswerte für ein paar Alternativen berechnet, wobei die Zahlenkette „98" den höchsten Wahrscheinlichkeitswert aufweist, die Zahlenkette „92" den nächsthöchsten Wert aufweist, die Zahlenkette „12" den nächsthöchsten Wert aufweist und noch eine weitere Erkennung für die Zahlenkette „18" berechnet wird. Darüber hinaus enthalten die Zeilen der Tabelle die falschen Daten, welche zu Beginn 0 sind, d.h. es sind noch keine falschen Zahlenketten bekannt. Nachdem die Erkennungseinheit 7 die Zahlenkette „98" vorgeschlagen und der Benutzer gemeldet hat, dass sie falsch ist, versetzt die Erkennungseinheit 7 die Fehlerdaten auf der Zeile in einen anderen Zustand, z.B. in den Logisch-1-Zustand. Demnach stellt die Erkennungseinheit 7 bei neuerlicher Durchführung der Erkennung fest, dass die Fehlerdaten der Zeile 1 sind, und übergeht diese Zeile, indem zur nächsten Zeile weiter geht, welche in diesem Fall ebenso falsch ist. Nachdem die ganze Zahlenkette richtig erkannt ist (in diesem Beispiel die dritte Alternative), fügt die Erkennungseinheit 7 diese Zahlenkette am Ende der möglicherweise bereits erkannten Zahlenketten hinzu, stellt den Inhalt der Tabelle auf Null zurück und wartet auf die nächste Zahlenkette oder, wenn bereits die ganze Telefonnummer richtig erkannt wurde, geht die Erkennungseinheit 7 zum Wählen der Telefonnummer über. Tabelle 2 stellt eine Situation dar, in welcher die Erkennungseinheit die richtige Zahlenfolge festgestellt hat. Es versteht sich von selbst, dass die Tabelle auf etliche verschiedene Arten und Weisen realisiert werden kann, welche Stand der Technik und einem Fachmann bekannt sind.

Tabelle 1
Tabelle 2

Die Erfindung kann auch in solchen sprachgesteuerten Telekommunikationsendgeräten angewendet werden, in welchen die Telefonnummer auch durch Verwenden von Identifikationen und/oder Teilidentifikationen gewählt werden kann. Demnach entspricht das Verfahren in seinen allgemeinen Zügen der zuvor dargelegten Nummernwahl, wobei eine Identifikation einer Telefonnummer entspricht und eine Teilidentifikation einem Teil der Telefonnummer entspricht, und der Vergleich erfolgt auf der Basis dieser Identifikationen und möglichen Teilidentifikationen.

Die angehängte 2 veranschaulicht die Funktionsweise des Verfahrens gemäß der ersten vorteilhaften Ausführungsform der Erfindung, sowie zum Vergleich die Funktionsweise des Verfahrens gemäß dem Stand der Technik in Tabellenform, wobei die linke Seite 201 der Tabelle 200 das Verfahren der Erfindung veranschaulicht und die rechte Seite 202 der Tabelle das Verfahren des Standes der Technik veranschaulicht. Der Benutzer beabsichtigt, die Telefonnummer „123456789" zu wählen, indem er sie in drei Zahlenketten, nämlich „123", „456" und „789", äußert. Die Benutzerspalten 203, 205 enthalten die Befehle, die vom Benutzer des Telekommunikationsendgeräts geäußert werden, und die Erkennungseinheitsspalten 204, 206 enthalten die Meldungen, die durch die Erkennungseinheit jeweils für den Benutzer erzeugt werden.

Ferner veranschaulicht die angehängte 3 die Funktionsweise des Verfahren gemäß der zweiten vorteilhaften Ausführungsform der Erfindung, sowie zum Vergleich die Funktionsweise das Verfahrens gemäß dem Stand der Technik in Tabellenform, wobei die linke Seite 301 der Tabelle 300 das Verfahren der Erfindung veranschaulicht und die rechte Seite 302 der Tabelle das Verfahren des Standes der Technik veranschaulicht. Die Benutzerspalten 303, 305 enthalten die Befehle, die vom Benutzer des Telekommunikationsendgeräts geäußert werden, und die Erkennungseinheitsspalten 304, 306 enthalten die Meldungen, die durch die Erkennungseinheit jeweils für den Benutzer erzeugt werden.

Die Erfindung ist nicht nur auf die zuvor dargelegten Ausführungsformen beschränkt, sondern sie kann innerhalb des Rahmens der angehängten Patentansprüche modifiziert werden.


Anspruch[de]
  1. Verfahren zum Wählen einer Telefonnummer durch Sprachbefehle, wobei die auszuwählende Telefonnummer als eine Folge von mehreren Zahlenketten, wobei jede Kette eine oder mehr Ziffern umfasst, geäußert und dann erkannt und zum Vergleich mit der Zahlenkette, die geäußert wurde, dargestellt wird, wie erkannt, umfassend die folgenden Schritte:

    Erkennen einer Zahlenkette einer geäußerten Telefonnummer, die ausgewählt werden soll, und Darstellen der Zahlenkette, die erkannt wird, wobei eine falsch erkannte Zahlenkette, die dargestellt wird, als falsch markiert wird,

    Erkennen einer Neuäußerung der Zahlenkette der auszuwählenden Telefonnummer und Darstellen der erkannten Zahlenkette der Neuäußerung, aber nicht Darstellen einer Zahlenkette, die als eine falsche markiert ist,

    dadurch gekennzeichnet, dass

    nach dem Markieren einer falsch erkannten Zahlenkette eine Tonmeldung oder eine Textmeldung von jenen Zahlenketten der auszuwählenden Telefonnummer, die richtig erkannt wurden, erzeugt wird.
  2. Verfahren nach Anspruch 1, wobei für jede geäußerte Zahlenkette zwei oder mehr Erkennungsalternativen erzeugt werden, für welche die Wahrscheinlichkeitswerte berechnet werden, dadurch gekennzeichnet, dass zu jeder Erkennungszeit vorgeschlagen wird, die Alternative auszuwählen, die den höchsten Wahrscheinlichkeitswert aufweist und die nicht als falsch markiert ist.
  3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass nach einer falschen Erkennung vorgeschlagen wird, die Alternative auszuwählen, die den nächsten Wahrscheinlichkeitswert jener Erkennungsalternativen aufweist, die nicht als falsch markiert sind.
  4. Telekommunikationsendgerät (1), umfassend:

    Mittel (2a, 2b, 6, 7, 8) zum Wählen einer Telefonnummer durch Sprachbefehle, welche Telefonnummer so ausgelegt ist, dass sie als eine Folge von mehreren Zahlenketten geäußert wird, wobei jede Kette eine oder mehr Ziffern umfasst,

    Mittel zum Erkennen einer geäußerten Telefonnummer, die ausgewählt werden soll,

    Mittel (3, 4) zum Darstellen der Zahlenkette, die erkannt wird, zum Vergleich mit der Zahlenkette, die geäußert wurde,

    Mittel (7, 10) zum Markieren einer falsch erkannten Zahlenkette als falsch,

    dadurch gekennzeichnet, dass

    die Mittel (2a, 2b, 4) zum Darstellen so ausgelegt sind, dass sie nach dem Markieren einer falsch erkannten Zahlenkette eine Tonmeldung oder eine Textmeldung von jenen Zahlenketten der auszuwählenden Telefonnummer, die richtig erkannt wurden, erzeugen.
  5. Telekommunikationsendgerät (1) nach Anspruch 4, dadurch gekennzeichnet, dass eine falsche Erkennung so ausgelegt ist, dass sie der Erkennereinheit (7) durch einen Sprachbefehl bekannt gemacht wird.
  6. Telekommunikationsendgerät (1) nach Anspruch 5, dadurch gekennzeichnet, dass es Mittel (3, 4) zum Erzeugen einer Bestätigungsmeldung von einem Sprachbefehl, der eine Fehlererkennung angibt, umfasst.
  7. Telekommunikationsendgerät (1) nach einem der Ansprüche 4 bis 6, dadurch gekennzeichnet, dass es eine Mobilstation (1) ist.
Es folgen 3 Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com