PatentDe  


Dokumentenidentifikation DE60310785T2 25.10.2007
EP-Veröffentlichungsnummer 0001339206
Titel Verfahren und Vorrichtung zur Übersetzung von gesprochener Sprache
Anmelder Mitel Networks Corporation, Ottawa, Ontario, CA
Erfinder Lord, John Raymond, Stittsville, Ontario K2S 1H6, CA
Vertreter derzeit kein Vertreter bestellt
DE-Aktenzeichen 60310785
Vertragsstaaten DE, FR, GB
Sprache des Dokument EN
EP-Anmeldetag 12.02.2003
EP-Aktenzeichen 032508517
EP-Offenlegungsdatum 27.08.2003
EP date of grant 03.01.2007
Veröffentlichungstag im Patentblatt 25.10.2007
IPC-Hauptklasse H04M 3/493(2006.01)A, F, I, 20051017, B, H, EP
IPC-Nebenklasse G06F 17/28(2006.01)A, L, I, 20051017, B, H, EP   

Beschreibung[de]
GEBIET DER ERFINDUNG

Diese Erfindung betrifft allgemein Sprachkommunikationssysteme, und die Erfindung betrifft insbesondere ein Verfahren und System für sprachaktivierte Sprachübersetzung.

HINTERGRUND DER ERFINDUNG

Internationale Reisende sind mit Schwierigkeiten vertraut, die beim Kommunizieren in der Muttersprache eines Reisenden mit einer ansässigen Person auftreten können, die nicht die Sprache des Reisenden spricht. Diese Schwierigkeiten werden verschlimmert, wenn telefonisch kommuniziert wird, weil beim Telefonieren Handgesten und andere Körpersprache nicht benutzt werden können, um zu helfen, die Bedeutung einer gesprochenen Phrase der ansässigen Person deutlich zu machen, die die Muttersprache des Reisenden nicht fließend spricht. Herkömmlicherweise haben Reisende von Sprachwörterbüchern Gebrauch gemacht, um Wortübersetzungen nachzuschlagen, oder haben einen Umstehenden um Hilfe gebeten, der die Fähigkeit hat, für den Reisenden zu übersetzen. Das Benutzen von Sprachwörterbüchern ist jedoch umständlich und zeitraubend, und eine andere Person zum Übersetzen heranzuziehen, kann sehr umständlich und teuer sein.

Elektronische Übersetzungseinrichtungen sind erhältlich, die einer Person ermöglichen, eine Phrase zu sprechen und von der Einrichtung eine gesprochene Übersetzung der Phrase anzufordern. Dieser elektronische Fortschritt überwindet einige der Schwierigkeiten beim Gebrauch von herkömmlichen Wörterbüchern. Der Gebrauch solcher Einrichtungen erfordert jedoch, dass die Einrichtungen zum Gebrauch getragen werden oder bei Bedarf anderweitig zur Verfügung stehen. So sind elektronische Übersetzungseinrichtungen nicht kostengünstig oder sie sind umständlich für bestimmte Anwendungen wie beispielsweise Einzelhandelsläden, Flughäfen, Hotels und Krankenhäuser.

Einzelhandelläden können eine über große Flächen verteilte große Anzahl von Mitarbeitern haben. In dieser Umgebung wäre es nicht kostengünstig, wenn jeder Mitarbeiter eine Übersetzungseinrichtung trüge, um sich mit Kunden in einer anderen Sprache zu verständigen. Da außerdem die Kunden im Allgemeinen mit den Mitarbeitern über große Flächen der Einzelhandelsgeschäfte interagieren, ist es unpraktisch, entweder die Übersetzungseinrichtungen zu den Kunden zu bringen oder die Kunden zu den Übersetzungseinrichtungen zu bringen. Eine ähnliche Umgebung gibt es in Flughäfen, Krankenhäusern und Hotels.

Ein weiterer Nachteil von tragbaren elektronischen Übersetzungseinrichtungen sind ihre begrenzten Fähigkeiten. Wegen der Tragbarkeit und Wirtschaftlichkeit müssen diese Einrichtungen klein und leichtgewichtig konstruiert sein. Diese Merkmale werden typischerweise mit begrenzten Fähigkeiten bezahlt, wie beispielsweise weniger leistungsstarken Spracherkennungsalgorithmen, geringer Speicherkapazität für Wörter und weniger Sprachen.

US-Patent 4.882.681 beschreibt ein Verfahren für die Simultanübersetzung von Unterhaltung zwischen zwei Beteiligten, in der der erste Beteiligte Sprache zum Übersetzen an einen entfernten Übersetzungscomputer sendet, der die Übersetzung an beide Beteiligte zurücksendet. Ein System wird beschrieben, das eine Kommunikationsschnittstelle umfasst zum Abwickeln von mindestens einer Anforderung, eine Sprachnachricht zu empfangen und eine Sprachausgabe zu senden, sowie ein an die Kommunikationsschnittstelle angeschlossenes Spracherkennungssystem zum Umwandeln einer Sprachnachricht in eine erste Textnachricht in einer ersten Sprache. Das System umfasst auch eine Text-zu-Sprach-System zum Umwandeln einer zweiten Textnachricht in eine Sprachausgabe in einer zweiten Sprache zum Senden über die Kommunikationsschnittstelle sowie eine an das Spracherkennungssystem und das Text-zu-Sprach-System angeschlossene Sprachübersetzungsanwendung. Das Sprachübersetzungssystem übersetzt die erste Textnachricht aus der ersten Sprache in die zweite Textnachricht in der zweiten Sprache und sendet die zweite Textnachricht an das Text-zu-Sprach-System zum Umwandeln in die Sprachausgabe.

ZUSAMMENFASSUNG DER ERFINDUNG

Die vorliegende Erfindung ist durch ein System gemäß Patentanspruch 1 und ein Verfahren gemäß Patentanspruch 7 definiert.

Gemäß einem Aspekt der vorliegenden Erfindung wird ein Kommunikationssystem bereitgestellt, das einem Benutzer ermöglicht, mit einem sprachaktivierten Sprachübersetzungssystem (VALTS) zu kommunizieren. Das VALTS umfasst ein Spracherkennungssystem (VRS) zum Erkennen einer Sprachnachricht in einer ersten Sprache und zum Umwandeln der Nachricht in einen ersten Text in der ersten Sprache; eine Textübersetzungsanwendung zum Übersetzen des ersten Texts in einen zweiten Text in einer zweiten Sprache; und ein Text-zu-Sprach-System zum Umwandeln des zweiten Texts in Sprache.

Vorzugsweise wird das System unter Verwendung von Funktelefontechnologie implementiert. So kann beispielsweise ein Englisch sprechender Reisender in einem Hotel in einem Land, in dem Englisch normalerweise nicht gesprochen wird, ein Funktelefon benutzen, um mit einer Person zu kommunizieren, die Spanisch spricht. Der Reisende greift auf das VALTS zu, indem er eine Telefonnummer wählt, und stellt das VALTS auf Englisch-Spanisch-Übersetzung ein, und danach werden in das Funktelefon gesprochene Sätze ins Spanische übersetzt und auf Spanisch ausgegeben. Das VALTS kann für Spanisch-Englisch-Umwandlung neu eingestellt werden, um die Antworten der Spanisch sprechenden Person zu übersetzen.

Gemäß einem Aspekt der vorliegenden Erfindung wird ein sprachaktiviertes Sprachübersetzungssystem bereitgestellt, auf das durch Telefone zugegriffen wird, wo Sprachnachrichten eines Anrufers in eine ausgewählte Sprache übersetzt werden und an den Anrufer ausgegeben oder wahlweise an einen anderen Anrufer gesendet werden. Ein Spracherkennungssystem wandelt die Sprachnachricht in Text einer ersten Sprache um. Der Text wird dann in Text der ausgewählten Sprache übersetzt. Der Text der ausgewählten Sprache wird dann in Sprache umgewandelt.

Die Vorteile der vorliegenden Erfindung umfassen das Vorhandensein von leistungsstarken Fähigkeiten bei relativ niedrigen Kosten. Da das VALTS entfernt von den Benutzern an einem zentralen Ort lokalisiert ist, sind Größe und Raum des VALTS kein Problem und die Kosten des VALTS können auf eine große Anzahl von Benutzern verteilt werden. Da außerdem auf das VALTS über Telefone zugegriffen wird, ist das Zugriffsmittel schon weitgehend verfügbar. Das VALTS kann außerdem leicht konfiguriert werden, um verschiedenen Zugriffstelefonnummern verschiedene Dienste zu bieten. Beispielsweise können Tausende von häufig gesprochenen Phrasen und Wörtern für verschieden angezielte Umgebungen erzeugt werden, weshalb eine Telefonnummer Zugriff auf Hotelphrasen bereitstellen kann, während eine andere Telefonnummer Zugriff auf Flughafenphrasen bereitstellen kann.

Gemäß einem anderen Aspekt der vorliegenden Erfindung wird ein sprachaktiviertes Sprachübersetzungssystem bereitgestellt, umfassend: eine Kommunikationsschnittstelle zum Abwickeln von mindestens einem Anruf, um eine Sprachnachricht zu empfangen und eine Sprachausgabe zu senden; ein an die Kommunikationsschnittstelle angeschlossenes Spracherkennungssystem zum Umwandeln der Sprachnachricht in eine erste Textnachricht in einer ersten Sprache und zum Umwandeln einer zweiten Textnachricht in die Sprachausgabe in einer zweiten Sprache zum Senden über die Kommunikationsschnittstelle; und eine an das Spracherkennungssystem angeschlossene Sprachübersetzungsanwendung zum Übersetzen der ersten Textnachricht aus der ersten Sprache in die zweite Textnachricht in der zweiten Sprache und zum Senden der zweiten Textnachricht an das Spracherkennungssystem zum Umwandeln in die Sprachausgabe.

Gemäß einem anderen Aspekt der vorliegenden Erfindung wird ein Verfahren zum Bereitstellen von sprachaktivierter Sprachübersetzung zur Verfügung gestellt, umfassend: Abwickeln von mindestens einem Anruf zum Empfangen einer Sprachnachricht; Umwandeln der Sprachnachricht in eine erste Textnachricht in einer ersten Sprache; Übersetzen der ersten Textnachricht aus der ersten Sprache in eine zweite Textnachricht in einer zweiten Sprache; Umwandeln der zweiten Textnachricht in eine Sprachausgabe in der zweiten Sprache; und Abwickeln des mindestens einen Anrufs zum Senden der Sprachausgabe.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Die vorliegende Erfindung wird detailliert beschrieben mit Bezug auf die beigefügten Zeichnungen, in denen ähnliche Ziffern ähnliche Teile bezeichnen und in denen

ein Blockdiagramm eines Kommunikationssystems mit einem sprachaktivierten Sprachübersetzungssystem (VALTS) gemäß einer Ausführungsart der vorliegenden Erfindung ist;

ein Blockdiagramm des VALTS von ist;

ein Blockdiagramm eines Kommunikationssystems mit einem VALTS und einem Sprachgateway gemäß einer anderen Ausführungsart der vorliegenden Erfindung ist; und

ein Blockdiagramm einer Implementierung eines Teils des Kommunikationssystems von ist.

DETAILLIERTE BESCHREIBUNG

In wird ein Blockdiagramm eines Kommunikationssystems 100 gezeigt mit einem sprachaktivierten Sprachübersetzungssystem (VALTS) 110 gemäß einer Ausführungsart der vorliegenden Erfindung. Das Kommunikationssystem 100 umfasst das VALTS 110, ein Netz 120 und Kommunikationseinrichtungen 130. Das Netz 120 enthält das öffentliche Fernsprechwählnetz (PSTN) und lokale Datennetze (LANs). Die Kommunikationseinrichtungen 130 enthalten POTS- und Funktelefone. Das VALTS 110 hat mindestens eine Telefonnummer für Zugriff durch die Kommunikationseinrichtungen 130.

In wird ein Blockdiagramm des VALTS 110 von gezeigt. Das VALTS 110 umfasst einen Server 200 mit einer Kommunikationsschnittstelle 210 zum Koppeln an das Netz 120; ein Anrufsteuerungsmodul 220 zum Abwickeln von Sprachanrufen von den Kommunikationseinrichtungen 130; ein Spracherkennungssystem (VRS) 230 zum Erkennen von Sprachnachrichten und zum Umwandeln der Nachrichten in Text; eine Sprachumwandlungsanwendung (LCA) 240 zum Übersetzen des Texts von einer Sprache in den Text einer anderen Sprache; und ein Text-zu-Sprach-System (TSS) 250 zum Umwandeln des Texts in Sprache der anderen Sprache. Das VRS 230, die LCA 240 und das TSS 250 sind im Fachbereich bekannt.

Zwei Betriebsmodi werden bereitgestellt, es wird aber deutlich sein, dass auch weitere Modi bereitgestellt werden können. In einem ersten Modus greift ein Benutzer an einer Kommunikationseinrichtung 130 auf das VALTS 110 zu, wählt die zweite Sprache für die Übersetzung aus der ersten Sprache und spricht Phrasen in der ersten Sprache zum Übersetzen in die zweite Sprache. Nach jeder Phrase antwortet das VALTS 110 mit einer übersetzten Phrase in der gesprochenen Sprache der zweiten Sprache. Der Benutzer gibt die übersetzte Phrase an eine andere Person weiter. Der Benutzer setzt dann das VALTS 110 zurück zum Übersetzen der zweiten Sprache in die erste Sprache für eine Antwort von der anderen Person.

Im zweiten Modus greift eine Vielzahl von Benutzern an jeweiligen Kommunikationseinrichtungen 130 auf das VALTS 110 für eine Konferenzverbindung zu, wo die Phrasen von einem der Benutzer für die anderen Benutzer übersetzt werden. Als Alternative kann das VALTS 110 für alle von jedem der Benutzer gesprochenen Phrasen zum Übersetzen für jeden der anderen Benutzer eingestellt werden. Als weitere Alternative kann das VALTS 110 nur zum Übersetzen von bestimmten Sprachen für bestimmte Benutzer während einer Konferenzverbindung eingestellt werden. Außerdem kann das VALTS 110 eingestellt werden, sodass ein Benutzer nur die übersetzten Phrasen empfängt und nicht die Phrasen in ihrer ersten Sprache. Fachleuten wird deutlich sein, dass zum Einstellen des VALTS 110 eine Reihe von Permutationen und Kombinationen möglich sind.

Fachleuten wird außerdem deutlich sein, dass das VALTS 110 durch Verwendung einer Reihe von Verfahren eingestellt werden kann, einschließlich durch Befehle, die über Telefontastaturen eingegebenen werden, und durch Sprachbefehle.

In wird ein Blockdiagramm eines Kommunikationssystems 300 mit einem VALTS 350 und einem Sprachgateway 320 gemäß einer anderen Ausführungsart der vorliegenden Erfindung gezeigt. Das Kommunikationssystem 300 stellt Internet-Telefoniedienste (VoIP-Dienste) über ein LAN 310 mit dem Sprachgateway 320 bereit. Die Dienste des Sprachgateways 320 enthalten Nebenstellenanlagen-Funktionen (PBX-Funktionen) zum Vermitteln von Sprachanrufen vom PSTN 330 über ein PBX 332 und von an das LAN 310 angeschlossenen VoIP-Einrichtungen. Die VoIP-Einrichtungen enthalten Funktelefone 334 und Laptops 336, die über Zugriffspunkt 338 an das LAN 310 angeschlossen sind; und verdrahtete Tischcomputer 340. Das VALTS 350 ist eine der VoIP-Einrichtungen und hat mindestens eine Teilnehmerrufnummer zum Zugriff. Dem Sprachgateway 320 erscheint das VALTS 350 als mindestens ein IP-Telefon. Das VALTS 350 kann zum Emulieren einer großen Anzahl solcher virtueller IP-Telefone konfiguriert werden. Außerdem können die VoIP-Einrichtungen über ein weiträumiges Netz (WAN) 345 an das LAN 310 angeschlossen werden. Das WAN 345 umfasst beispielsweise das Internet.

Das mit virtuellen IP-Telefonen ausgerüstete VALTS 350 ist deshalb besonders vorteilhaft, weil das VALTS 350 mehrere Anrufe simultan abwickeln kann, ohne weitere Telefonfestleitungen hinzufügen zu müssen, verglichen mit einer anderen Ausführungsart der vorliegenden Erfindung, wo ein VALTS durch Standard-POTS-Leitungen an ein herkömmliches PBX angeschlossen ist. So ist das VALTS 350 befähigt, so viele Anrufe abzuwickeln, wie es emulierbare virtuelle IP-Telefone gibt.

Fachleuten wird auch deutlich sein, dass ein VALTS ein separater, eigenständiger Server in einem Netz sein kann, oder dass das VALTS mit einem PBX oder Sprachgateway oder einer anderen an das Netz angeschlossenen geeigneten Einrichtung integriert sein kann.

In wird ein Blockdiagramm einer Implementierung eines Teils des Kommunikationssystems 300 von gezeigt. Das Sprachgateway 320 wird implementiert unter Verwendung eines Mitel Ipera 2000 R2.1 Kommunikationssystems (das System) 400 mit einem H.323 Sprachgateway (HVG) 410. Der Einfachheit halber wird das System 400 in mit nur drei Endpunkten gezeigt: einem IP-Telefon 420, einem Funktelefon 430 und einem VRS 480. In der Praxis wird eine Vielzahl von Endpunkten bereitgestellt, und die Kommunikationen zwischen ihnen werden von einer Anrufsteuerungs-Engine 415 gesteuert.

Das System 400 ist ein serverbasiertes, im Handel erhältliches iPBX, hergestellt von der Mitel Networks Corporation. Das System 400 ist in einem Windows® NT Server implementiert, der dazu modifiziert ist, Telekommunikations-Hardware zu umfassen. Die Anrufsteuerungs-Engine 415 stellt Kommunikationssteuerung zwischen Endpunkten, wie beispielsweise dem IP-Telefon 420 (Mitel IP 4025 Phone), über einen IP-Service-Provider (IP SP) 425 bereit. Der IP SP 425 wickelt jegliche TCP/IP-Kommunikation mit den Endpunkten ab.

Das IP-Telefon 420 ist eine Stimuluseinrichtung, die Nachrichten für alle Aktionen an das System 400 sendet und von ihm empfängt. Der IP SP 425 verarbeitet alle vom IP-Telefon 420 empfangenen Minet-Nachrichten und routet die Minet-Nachrichten zum Weiterverarbeiten an passende Softwareteile im System 400. Die Minet-Nachrichten sind Teil eines proprietären Nachrichtenprotokolls (Minet-Protokoll) der Mitel Networks Corporation. Das Minet-Protokoll wird dazu benutzt, Anrufe zwischen IP-Telefonen aufzubauen. Der IP SP 425 wickelt das Datenstreaming zwischen IP-Telefonen und anderen Endpunkten unter Steuerung der Anrufsteuerungs-Engine 415 ab.

Das H.323 Sprachgateway (HVG) 410 ist eine im Handel erhältliche Option des Systems 400. Das HVG 400 koppelt H.323-konforme Telefoneinrichtungen an das System 400, sodass die H.323-konformen Telefoneinrichtungen als IP-Telefone erscheinen.

Das Funktelefon 430 ist ein im Handel erhältliches Produkt, wie beispielsweise ein Netvision-Telefon (NVP) der Firma Symbol Technologies. Das NVP 430 ist über einen Zugriffspunkt 450 an das Kommunikationssystem angebunden. Der Zugriffspunkt 450 wandelt Funksignale (IFEE 802.11 Funkprotokoll) des NVP 430 in IP-Pakete um und umgekehrt. Die IP-Pakete werden über das LAN 310 mit dem HVG 400 unter Verwendung des H.323-Protokolls ausgetauscht.

Am HVG 400 werden die IP-Pakete durch einen H.323-Protokollstack 445 empfangen und verarbeitet, und die Nachrichteninhalte der IP-Pakete werden an einen NVP-Gerätecontroller 440 weitergeleitet. Ebenso werden Nachrichten vom NVP-Gerätecontroller 440 durch den H.323-Protokollstack 445 empfangen und in die IP-Pakete umgewandelt, die dann an den Zugriffspunkt 450 zur Sendung an das NVP 430 weitergeleitet werden.

Das HVG 410 umfasst außerdem eine HVG-Anrufsteuerung 435 zum Steuern von Kommunikationen zwischen an den NVP-Gerätecontroller 440 angeschlossenen Endpunkten; eine TAPI-Anwendungsschnittstelle 455 für das HVG 410 zum Austausch von Anrufsteuerungs-Signalisierungsnachrichten mit dem System 400; und einen IP-Telefon-Proxy 470, der alle notwendigen Nachrichten bereitstellen soll, damit an den NVP-Gerätecontroller 440 angeschlossene Telefoneinrichtungen als beim System 400 registrierte IP-Telefoneinrichtungen zum IP SP 425 erscheinen. Das System 400 hat eine TAPI-Serverschnittstelle 460 zum Verbinden mit der TAPI-Anwendungsschnittstelle 455 des HVG 410. Die TAPI-Schnittstelle 455, 460 kommuniziert Q.931-artige Anrufsteuerungs-Signalisierungsnachrichten. TAPI ist ein bekanntes Microsoft-Schnittstellenprotokoll, das zum Aufbau von Anrufen zwischen Endpunkten benutzt wird.

Weitere Endpunkte wie beispielsweise andere IP-Telefone und POTS-Telefone können über POTS-Gerätecontroller bzw. IP-Gerätecontroller dem System 400 hinzugefügt werden.

Ein Spracherkennungssystem (VRS) 480 ist als ein das Minet-Protokoll benutzendes IP-Telefon (z. B. das von der Mitel Networks Corporation hergestellte 4025 IP-Telefon) an das System 400 angeschlossen. Das VRS 480 ist eine Version des Mitel Networks-Produkts Speak@Ease, das modifiziert ist, um als IP-Telefon zu erscheinen. So meldet das System 400, um mit dem VRS 480 zu kommunizieren, einfach einen Anruf an ein Ziel an, das vom System 400 als ein IP-Telefon angesehen wird, und es wird eine Verbindung mit dem Endpunkt hergestellt. Sobald ein Sprachpfad hergestellt ist, verarbeitet das VRS 480 eingehende Sprachnachrichten und gleicht die Phrasen der empfangenen Sprachnachrichten mit seiner internen Grammatikdefinition ab. Das VRS 480 bedient sich der Methode der besten Abgleichung, um die Sprachnachrichten in Textnachrichten zu übersetzen. In Fällen, wo das VRS 480 keine Abgleichung finden kann, antwortet es mit einer Nachricht, die Phrase zu wiederholen oder anders zu formulieren.

Das VRS 480 leitet die Textnachrichten an eine Sprachumwandlungsanwendung (LCA) 485 weiter zum Übersetzen in Textrepräsentationen in einer anderen Sprache. Die Textrepräsentationen werden an das VRS 480 zurückgeschickt und in gesprochene Sprache der anderen Sprache als Sprachantworten (oder übersetzte Sprachnachrichten) auf die Sprachnachrichten umgewandelt. Die LCA 485 wird unter Verwendung von L&HTM Power Translator® Pro implementiert, aber es sind auch andere, ähnliche Textübersetzungsanwendungen bekannt.

In Betrieb meldet sich beispielsweise ein Benutzer am NVP 430 beim HVG 410 unter Verwendung eines Passworts an. Der Benutzer wählt dann eine ausgewählte Teilnehmerrufnummer (DN), die mit dem VRS 480 verbindet. Das HVG 410 informiert das System 400, dass eine IP-Telefoneinrichtung, das NVP 430, einen Anruf an eine andere örtliche IP-Telefoneinrichtung, das VRS 480, anmeldet. Das VRS 480 funktioniert wie ein IP-Telefon zum System 400. Unter Verwendung der Schnittstelle von der TAPI-Anwendung 455 zum TAPI-Server 465, der Schnittstelle vom IP-Telefon-Proxy 470 zum IP SP 425 und der Schnittstelle vom IP SP 425 zum VRS 480 wird ein Anruf zwischen dem NVP 430 und dem VRS 480 aufgebaut. IP-Pakete mit digitalisierter Sprache werden dann direkt zwischen dem NVP 430 und dem VRS 480 über das LAN 310 gestreamt.

Sobald eine Sprachverbindung zwischen dem VRS 480 und dem NVP 430 aufgebaut ist, spricht der Benutzer am NVP 430 zum VRS 480 und weist das VRS 480 an, die Sprachnachrichten von einer Sprache in eine andere umzuwandeln. Beispielsweise kann das VRS 480 den Benutzer auffordern, die Sprache mündlich zu benennen, in die umgewandelt werden soll. Der Benutzer verwendet dann das NVP 430 nach Walkie-Talkie-Art, indem er einen Knopf auf dem NVP 430 zum Sprechen drückt, und das NVP 430 gibt die umgewandelte Phrase aus. So kann der Benutzer einen Satz sprechen und unter Verwendung des einen Telefons eine andere Person die Antwort in einer anderen Sprache hören lassen.

Das System 400 kann auch dazu konfiguriert werden, dass zwei Personen in ihren eigenen Muttersprachen miteinander sprechen können, allerdings über verschiedene Telefone, wobei jeder Sprecher in seiner eigenen Sprache spricht und zuhört. Beispielsweise wird ein VRS 480 aufgefordert, die übersetzten Sprachnachrichten (oder Sprachausgaben) einem anderen Anrufer oder einer Reihe von anderen Anrufern zu senden.

Variationen und Modifikationen der Erfindungen werden in Erwägung gezogen. Beispielsweise muss die Schnittstelle zum HVG 410 nicht auf dem H.323-Standard basieren. Die Schnittstelle könnte auch auf dem SIP (Session Initiation Protocol) oder irgendeinem anderen industriellen Standardprotokoll basieren. Das HVG 410 kann mit einer Reihe von anderen Einrichtungen (d. h. worin das HVG die Sprachverbindungen zwischen dem VRS 480 und einer anderen Einrichtung aufbaut und steuert) kommunizieren. Das VRS 480 kann übersetzte Sprachnachrichten an eine andere Audioeinrichtung senden (z. B. an einen Lautsprechen, um zu einer Zuhörerschaft zu sprechen).

Die Sprachumwandlungsanwendung 485 kann die übersetzte Textrepräsentation auch an eine Einrichtung mit einem Bildschirm schicken (beispielsweise an ein Handgerät wie ein Palmpilot® Palmtop-Computer). Ebenso kann anstelle des NVP 430 ein drahtloses Handgerät (z. B. ein Palmtop-Computer mit drahtlosen Kommunikationsfähigkeiten) für den Telefonbetrieb konfiguriert werden.

Das VRS 480 kann außerdem dazu konfiguriert werden, dass ein Benutzer und seine bevorzugte Sprachauswahl dem System bekannt sind. Der Benutzer muss dann nur die Sprache mündlich benennen, in die der Benutzer seine Sprachnachrichten übersetzen möchte. So kann das VRS 480 dazu konfiguriert werden, dass der Benutzer die Sprache zum Übersetzen der Sprachnachrichten mündlich benennt.

Von allen solchen alternativen Ausführungsarten wird angenommen, dass sie dem Gebiet und Schutzbereich der Erfindung angehören, wie sie in den angefügten Patenansprüchen definiert sind.


Anspruch[de]
Sprachaktiviertes Sprachübersetzungssystem (110) mit:

einer Kommunikationsschnittstelle (210) zum Abwickeln von mindestens einem Anruf, um eine Sprachnachricht zu empfangen und eine Sprachausgabe zu senden;

einem an die Kommunikationsschnittstelle (210) angeschlossenen Spracherkennungssystem (230) zum Umwandeln der Sprachnachricht in eine erste Textnachricht in einer ersten Sprache;

einem Text-zu-Sprach-System (250) zum Umwandeln einer zweiten Textnachricht in die Sprachausgabe in einer zweiten Sprache zum Senden über die Kommunikationsschnittstelle (210); und

einer an das Spracherkennungssystem (230) und das Text-zu-Sprach-System (250) angeschlossenen Sprachübersetzungsanwendung (240) zum Übersetzen der ersten Textnachricht aus der ersten Sprache in die zweite Textnachricht in der zweiten Sprache und zum Senden der zweiten Textnachricht an das Text-zu-Sprach-System (250) zum Umwandeln in die Sprachausgabe;

worin die Kommunikationsschnittstelle (210) dazu angepasst ist, eine Telefoneinrichtung zu emulieren zum Empfang des mindestens einen Anrufs an einer gegebenen Teilnehmerrufnummer aus einer Vielzahl von Teilnehmerrufnummern,

und worin das sprachaktivierte Sprachübersetzungssystem dazu angepasst ist, für jede der Teilnehmerrufnummern einen unterschiedlichen Übersetzungsdienst für unterschiedliche Zielumgebungen bereitzustellen.
Sprachaktiviertes Sprachübersetzungssystem (110) nach Anspruch 1, außerdem eine Konfigurationsschnittstelle zur Auswahl der ersten Sprache und der zweiten Sprache aufweisend. Sprachaktiviertes Sprachübersetzungssystem (110) nach Anspruch 1, worin die Kommunikationsschnittstelle (210) die aus der Sprachnachricht eines Anrufers übersetzte Sprachausgabe an diesen Anrufer sendet. Sprachaktiviertes Sprachübersetzungssystem (110) nach Anspruch 1, worin die Kommunikationsschnittstelle (210) die aus der Sprachnachricht eines ersten Anrufers übersetzte Sprachausgabe an einen zweiten Anrufer sendet. Sprachaktiviertes Sprachübersetzungssystem (110) nach Anspruch 1, außerdem zum Erzeugen des Anrufs eines der Folgenden umfassend: Funktelefon, POTS-Telefon, IP-Telefon und drahtlosen Palmtop-Computer. Sprachaktiviertes Sprachübersetzungssystem (110) nach Anspruch 1, worin die Kommunikationsschnittstelle (210) zum Empfang des mindestens einen Anrufs eine IP-Telefoneinrichtung emuliert. Verfahren zum Bereitstellen einer sprachaktivierten Sprachübersetzung, Folgendes umfassend:

Abwickeln von mindestens einem Anruf, um eine Sprachnachricht zu empfangen;

Umwandeln der Sprachnachricht in eine erste Textnachricht in einer ersten Sprache;

Übersetzen der ersten Textnachricht aus der ersten Sprache in eine zweite Textnachricht in einer zweiten Sprache;

Umwandeln der zweiten Textnachricht in eine Sprachausgabe in der zweiten Sprache;

Abwickeln des mindestens einen Anrufs, um die Sprachausgabe zu senden; und

Emulieren einer Telefoneinrichtung zum Empfang des mindesten einen Anrufs an einer gegebenen Teilnehmerrufnummer aus einer für den Empfang des Anrufs bereitgestellten Vielzahl von Teilnehmerrufnummern, wobei der Übersetzungsschritt für jede der Teilnehmerrufnummern einen unterschiedlichen Übersetzungsdienst für unterschiedliche Zielumgebungen bereitstellt.
Verfahren nach Anspruch 7, außerdem das Bestimmen der ersten Sprache und der zweiten Sprache umfassend. Verfahren nach Anspruch 7, worin die aus der Sprachnachricht eines Anrufers übersetzte Sprachausgabe an den Anrufer gesendet wird. Verfahren nach Anspruch 7, worin die aus der Sprachnachricht eines ersten Anrufers übersetzte Sprachausgabe an einen zweiten Anrufer gesendet wird. Verfahren nach Anspruch 7, worin der Anruf von einem der Folgenden empfangen wird: Funktelefon, POTS-Telefon, IP-Telefon und drahtlosem Palmtop-Computer. Verfahren nach Anspruch 7, worin die Telefoneinrichtung eine IP-Telefoneinrichtung zum Empfang des mindestens einen Anrufs umfasst.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com