Warning: fopen(111data/log202008111920.log): failed to open stream: No space left on device in /home/pde321/public_html/header.php on line 107

Warning: flock() expects parameter 1 to be resource, boolean given in /home/pde321/public_html/header.php on line 108

Warning: fclose() expects parameter 1 to be resource, boolean given in /home/pde321/public_html/header.php on line 113
Sprachdekoder zur Erzeugung von Hintergrundgeräuschen - Dokument DE69425226T2
 
PatentDe  


Dokumentenidentifikation DE69425226T2 01.03.2001
EP-Veröffentlichungsnummer 0657872
Titel Sprachdekoder zur Erzeugung von Hintergrundgeräuschen
Anmelder NEC Corp., Tokio/Tokyo, JP
Erfinder Ozawa, Kazunori, Tokyo, JP
Vertreter Betten & Resch, 80469 München
DE-Aktenzeichen 69425226
Vertragsstaaten DE, FR, GB, IT
Sprache des Dokument EN
EP-Anmeldetag 07.12.1994
EP-Aktenzeichen 941193435
EP-Offenlegungsdatum 14.06.1995
EP date of grant 12.07.2000
Veröffentlichungstag im Patentblatt 01.03.2001
IPC-Hauptklasse G10L 19/00

Beschreibung[de]
HINTERGRUND DER ERFINDUNG Gebiet der Erfindung:

Die vorliegende Erfindung betrifft ein System zum guten Wiedergeben bzw. Reproduzieren von Hintergrundgeräusch, das einem Sprachsignal überlagert ist, und insbesondere einen Sprachdecodierer zum Verbessern der Reproduzierbarkeit von Hintergrundgeräuschen, um eine Sprachqualität durch eine Signalverarbeitung nur auf einer Empfängerseite zu erhöhen, ohne irgendwelche Hilfsinformationen über das Hintergrundgeräusch von einer Senderseite zu bekommen.

Beschreibung des Standes der Technik:

Ein bekanntes System zum Codieren und Decodieren von Sprachsignalen, die mit niedrigen Bitraten übertragen werden, ist ein CELP-System, wie es in "CODE- EXCITED LINEAR PREDICTION (CELP): HIGH-QUALITY SPEECH AT VERY LOW BIT RATES", geschrieben von M. R. Schroeder und B. S. Atal (Proc. ICASSP. S. 937-940, 1985) (Literatur 1) beschrieben ist. Ein System zum Verbessern einer Sprachqualität bei den niedrigen CELP-Bitraten ist in der offengelegten japanischen Patentanmeldung Nr. 3-243999 (Literatur 2) offenbart.

Die in den Literaturstellen 1, 2 offenbarten herkömmlichen Systeme haben ein Problem, das darin besteht, daß es dann, wenn ein Hintergrundgeräusch einem Sprachsignal überlagert ist, schwierig ist, das Hintergrundgeräusch in Intervallen ohne Sprache gut darzustellen, was in einer schlechten Sprachqualität resultiert, und zwar bei niedrigen Bitraten von 4,8 kb/s oder darunter.

Aus der EP-A-0 544 101 ist ein Sprachdecodierer bekannt, der eine Decodiereinrichtung zum Decodieren eines codierten Eingangssignals, eine Spracherfassungseinrichtung zum Erfassen eines Sprachintervalls und eines Intervalls ohne Sprache, eine Hintergrundgeräusch-Synthetisiereinrichtung zum Synthetisieren von Hintergrundgeräusch, eine Schalteinrichtung zum Schalten zwischen einer Ausgabe der Decodiereinrichtung und der Hintergrundgeräusch-Synthetisiereinrichtung und eine Signalreproduktionseinrichtung zum Reproduzieren eines durch die Schalteinrichtung ausgewählten Signals aufweist. Die Hintergrundgeräusch- Synthetisiereinrichtung synthetisiert einen Hintergrundton basierend auf Hintergrundgeräuschparametercodes, die mit dem Übertragungssignal codiert sind, und einem Zufallsmustergenerator.

ZUSAMMENFASSUNG DER ERFINDUNG

Es ist eine Aufgabe der vorliegenden Erfindung, einen Sprachdecodierer zum guten Reproduzieren eines Hintergrundgeräuschsignals durch einen Sprachdecodierprozeß bei einem Empfänger ohne irgendwelche Änderungen in bezug auf codierte Geschwindigkeitssignale und ohne irgendwelche hinzugefügte Hilfsinformationen von einem Codierer zur Verfügung zu stellen.

Es ist eine weitere Aufgabe der vorliegenden Erfindung, einen Sprachdecodierer zum Reproduzieren von Geräuschen in einem Intervall ohne Sprache von einem Zufallszahlencodevektor zur Verfügung zu stellen, und das reproduzierte Geräuschen als das Hintergrundgeräusch zu verwenden, das einen übertragenen Ton für das Ohr natürlich macht und ein Hören im Intervall ohne Sprache nicht stört.

Gemäß einem ersten Aspekt der vorliegenden Erfindung ist ein Sprachdecodierer geschaffen, der folgendes aufweist: eine Decodiereinrichtung zum Decodieren eines binären codierten Eingangssignals in einen spektralen Parameter, eine Durchschnittsamplitude, eine Abstandsperiode und ein Tonquellensignal; eine Spracherfassungseinrichtung zum Erfassen eines Intervalls ohne Sprache und eines Sprachintervalls unter Verwendung von wenigstens einem von dem spektralen Parameter, der Durchschnittsamplitude und der Abstandsperiode; eine Erregersignal- Erzeugungseinrichtung zum Erzeugen eines Erregersignals unter Verwendung des Tonquellensignals, der Durchschnittsamplitude und der Abstandsperiode; eine erste Signalreproduktionseinrichtung zum Reproduzieren eines Tonsignals unter Verwendung des Erregersignals von der Erregersignal-Erzeugungseinrichtung und des spektralen Parameters von der Decodiereinrichtung; eine Speichereinrichtung zum Speichern eines Zufallszahlencodebuchs, das Zufallszahlencodevektoren speichert, die beim Reproduzieren von Tonsignalen verwendet werden können; eine Sucheinrichtung zum Durchsuchen des Zufallszahlencodebuchs und zum Auswählen eines Zufallszahlencodevektors, der zum Reproduzieren eines Tonsignals verwendet werden kann, das dem Ausgangssignal am nächsten ist, das im Intervall ohne Sprache durch die erste Signalreproduktionseinrichtung reproduziert wird; eine zweite Signalreproduktionseinrichtung zum Reproduzieren eines Tonsignals unter Verwendung des spektralen Parameters von der Decodiereinrichtung und des Zufallszahlencodevektors, der durch die Sucheinrichtung gesucht worden ist; und eine Schalteinrichtung zum Ausgeben des Tonsignals von der ersten Signalreproduktionseinrichtung im Sprachsignal oder zum Ausgeben des Tonsignals von der zweiten Signalreproduktionseinrichtung im Intervall ohne Sprache.

Gemäß einem zweiten Aspekt der vorliegenden Erfindung ist ein Sprachdecodierer geschaffen, der folgendes aufweist: eine Decodiereinrichtung zum Decodieren eines binären codierten Eingangssignals in einen spektralen Parameter, eine Durchschnittsamplitude, eine Abstandsperiode und ein Tonquellensignal; eine Spracherfassungseinrichtung zum Erfassen eines Intervalls ohne Sprache und eines Sprachsignals unter Verwendung von wenigstens einem von dem spektralen Parameter, der Durchschnittsamplitude und der Abstandsperiode; eine Erregersignal- Erzeugungseinrichtung zum Erzeugen eines Erregersignals zur Verwendung des Tonquellensignals, der Durchschnittsamplitude und der Abstandsperiode; eine Speichereinrichtung zum Speichern eines Zufallszahlencodebuchs, das Zufallszahlencodevektoren speichert, die beim Reproduzieren von Tonsignalen verwendet werden können; eine Sucheinrichtung zum Durchsuchen des Zufallszahlencodebuchs nach einen Zufallszahlencodevektor, der beim Reproduzieren eines Tonsignals verwendet werden kann, das einem Tonsignal am nächsten ist, das aus dem Erregersignal im Intervall ohne Sprache reproduzierbar ist; eine Schalteinrichtung zum Ausgeben des Erregersignals von der Erregersignal-Erzeugungseinrichtung im Sprachintervall oder zum Ausgeben des Zufallszahlencodevektors, der im Intervall ohne Sprache durch die Sucheinrichtung gesucht worden ist; und eine Signalreproduktionseinrichtung zum Reproduzieren eines Tonsignals unter Verwendung des spektralen Parameters von der Decodiereinrichtung und der Ausgabe von der Schalteinrichtung.

Es ist vorzuziehen, daß die Sucheinrichtung des Sprachdecodierers eine Verstärkung berechnet, die durch die zweite Signalreproduktionseinrichtung zum Einstellen einer Durchschnittsamplitude des Tonsignals verwendet wird, das von dem ausgewählten Zufallszahlencodevektor reproduziert wird, so daß die Durchschnittsamplituden der Tonsignale der ersten und der zweiten Signale der ersten und der zweiten Signalreproduktionseinrichtung im Intervall ohne Sprache nahezu gleich werden.

Weiterhin weist die Erregersignal-Erzeugungseinrichtung vorzugsweise eine Unterdrückungseinrichtung zum Unterdrücken der Durchschnittsamplitude im Intervall ohne Sprache auf.

Die Sucheinrichtung weist eine Aktualisierungs-Einrichtung zum Aktualisieren des Zufallszahlencodebuchs bei einem vorbestimmten Zeitintervall auf.

Gemäß der vorliegenden Erfindung empfängt die Decodiereinrichtung ein binäres codiertes Eingangssignal und wandelt es in einen spektralen Parameter, eine Durchschnittsamplitude, eine Abstandsperiode und ein Tonquellensignal um, und die Spracherfassungseinrichtung vergleicht wenigstens einen von dem spektralen Parameter, der Durchschnittsamplitude und der Abstandsperiode, z. B. die Durchschnittsamplitude, mit einer vorbestimmten Schwelle, um die Sprachintervalle und Intervalle ohne Sprache zu erfassen.

Alternativ dazu kann ein Prozeß verwendet werden, der in "SPEECH/SILENCE SEGMENTATION FOR REAL-TIME CODING VIA RULE BASED ADAPTIVE ENDPOINT DETECTION", geschrieben von J. Lynch, Jr., et al. (Proc. ICASSP, S. 1348-1351, 1987) (Literatur 3) beschrieben ist.

Die Erregersignal-Erzeugungseinrichtung erzeugt ein Erregersignal unter Verwendung des Tonquellensignals, der Durchschnittsamplitude und der Abstandsperiode, die durch die Decodiereinrichtung empfangen werden, und die erste Signalreproduktionseinrichtung treibt ein Filter, das aus dem Spektrumsparameter zusammengesetzt ist, um ein Tonsignal s(n) zu reproduzieren.

Die Sucheinrichtung speichert eine Gruppe von Zufallszahlencodevektoren einer vorbestimmten Bitzahl als Codebuch und durchsucht das Codebuch nach einem Zufallszahlencodevektor, der die folgende Gleichung maximiert:

(j = 0 .. 2B-1, B ist die Anzahl von Bits des Codebuchs)

wobei

ist, wobei s(n) ein reproduziertes Signal ist, das durch die erste Signalreproduktionseinrichtung erzeugt wird, cj(n) der j-te Zufallszahlencodevektor ist und h(n) eine Impulsantwort ist, die aus dem Spektrumsparameter bestimmt wird, der für das Filter verwendet wird.

Der Sprachdecodierer gemäß dem zweiten Aspekt der vorliegenden Erfindung arbeitet auf eine Weise, die unterschiedlich vom Sprachdecodierer gemäß dem ersten Aspekt der vorliegenden Erfindung ist, durch Verwenden der unten angegebenen Gleichung anstatt der obigen Gleichungen (1) und (2).

(j = 0 ... 2B-1, B ist die Anzahl von Bits des Codebuchs), wobei v(n) das Erregersignal, auf das oben Bezug genommen worden ist, im Sprachdecodierer gemäß dem ersten Aspekt der vorliegenden Erfindung ist.

Die obigen und andere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden aus der folgenden Beschreibung unter Bezugnahme auf die beigefügten Zeichnungen klar, die ein Beispiel bevorzugter Ausführungsbeispiele der vorliegenden Erfindung darstellen.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Fig. 1 ist ein Blockdiagramm eines Sprachdecodierers gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung;

Fig. 2 ist ein Blockdiagramm eines Sprachdecodierers gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung;

Fig. 3 ist ein Blockdiagramm eines Sprachdecodierers gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung;

Fig. 4 ist ein Blockdiagramm eines Sprachdecodierers gemäß einem vierten Ausführungsbeispiel der vorliegenden Erfindung;

Fig. 5 ist ein Blockdiagramm eines Sprachdecodierers gemäß einem fünften Ausführungsbeispiel der vorliegenden Erfindung; und

Fig. 6 ist ein Blockdiagramm eines Sprachdecodierers gemäß einem sechsten Ausführungsbeispiel der vorliegenden Erfindung.

DETAILLIERTE BESCHREIBUNG DER BEVORZUGTEN AUSFÜHRUNGSBEISPIELE

Wie es in Fig. 1 gezeigt ist, hat ein Sprachdecodierer gemäß einem ersten Ausführungsbeispiel der vorliegenden Erfindung einen Eingangsanschluß 100, dem ein binäres codiertes Eingangssignal zugeführt wird, und einen Ausgangsanschluß 230, von welchem ein reproduziertes Tonsignal (ein Sprachsignal in einem Sprachintervall und ein Geräusch in einem Intervall ohne Sprache) ausgegeben wird. Einer Decodierschaltung 110 wird das Eingangssignal vom Eingangsanschluß 100 bei vorbestimmten Zeitintervallen zugeführt (die hierin nachfolgend Frames genannt werden, die jeweils eine Zeitdauer von 2 ms haben). Die Decodierschaltung 110 decodiert das Eingangssignal in verschiedene Daten, einschließlich eines Spektrumparameters, z. B. eines LSP-(Leitungsspektrumspaar)-Koeffizienten I(i), einer Durchschnittsamplitude r, einer Abstandsperiode T und eines Tonquellensignals c(n).

Eine Spracherfassungsschaltung 120 bestimmt Sprachintervalle und Intervalle ohne Sprache in jedem Frame und gibt Informationen aus, die ein Sprachintervall oder ein Intervall ohne Sprache anzeigen. Das Sprachintervall und das Intervall ohne Sprache können gemäß dem oben beschriebenen Prozeß, gemäß der Literatur 3 oder gemäß anderen bekannten Prozessen bestimmt werden.

Eine Erregersignal-Erzeugungsschaltung 140 erzeugt ein Erregersignal v(n) unter Verwendung des Tonquellensignals c(n), der Durchschnittsamplitude r und der Abstandsperiode T von der Decodierschaltung 110. Das Erregersignal v(n) kann gemäß dem Prozeß berechnet werden, der in der oben angegebenen Literatur 2 beschrieben ist. (In der Literatur sollte auf die Gleichung (v(n) = r · c(n) + v(n-T)) Bezug genommen werden.)

Einer ersten Signalreproduktionsschaltung 160 wird der decodierte Spektrumsparameter I(i) (z. B. der LSP-Koeffizient) zugeführt, und sie wandelt den zugeführten Spektrumsparameter I(i) in einen linearen Vorhersagekoeffizienten α(i) um. Die Umwandlung vom Spektrumsparameter I(i) in den linearen Vorhersagekoeffizienten α(i) kann gemäß "QUANTIZER DESIGN IN LSP SPEECH ANALYSIS - SYNTHESIS", geschrieben von Sugamura, et al. (IEEE J. Sel. Areas Commun., S. 425-431, 1988) (Literatur 4) ausgeführt werden. Das Erregersignal wird gefiltert, um ein reproduziertes Signal gemäß der folgenden Gleichung zu bestimmen:

wobei s(n) das reproduzierte Signal ist und P der Grad des linearen Vorhersagekoeffizienten ist.

Eine Suchschaltung 180 sucht Zufallszahlencodevektoren, die in einem Codebuch 200 in einem Frame gespeichert sind, in welchem das Ausgangssignal von der Spracherfassungsschaltung 120 ein Intervall ohne Sprache darstellt, und wählt einen Zufallszahlenvektor aus, der das reproduzierte Signal s(n) gut darstellt. Das Codebuch 200 wird in einem Speicher gespeichert, und zwar vorzugsweise in einem ROM. Die Suchschaltung 180 sucht die Zufallszahlencodevektoren unter Venrwendung der oben angegebenen Gleichungen (1) und (2) und wählt einen Codevektor aus, der die Gleichung (1) maximiert, d. h. die Suchschaltung 180 durchsucht die Zufallszahlencodevektoren, um einen Codevektor auszuwählen, der zum Reproduzieren des Tonsignals verwendet werden kann, das dem Tonsignal von der ersten Signalreproduktionsschaltung 160 am nächsten ist. Die Impulsantwort h(n) in der Gleichung (2) ist dadurch bestimmt worden, daß sie vom linearen Vorhersagekoeffizienten umgewandelt worden ist. Für die Umwandlung vom linearen Vorhersagekoeffizienten in die Impulsantwort kann auf die Literatur 2 Bezug genommen werden. Die im Codebuch 200 gespeicherten Zufallszahlencodevektoren können Gauß'sche Zufallszahlen sein, die gemäß der Literatur 1 erzeugt werden können.

Die Suchschaltung 180 berechnet weiterhin eine Verstärkung gj gemäß der folgenden Gleichung:

wobei

Unter Verwendung des ausgewählten Zufallszahlencodevektors und der berechneten Verstärkung berechnet die Suchschaltung 180 ein Erregersignal v'(n) gemäß der nachfolgenden Gleichung (7) und gibt das berechnete Erregersignal v'(n) zu einer zweiten Signalreproduktionsschaltung 210 aus.

v'(n) = gj(n)cj(n)

Wenn ihr das berechnete Erregersignal v'(s) zugeführt wird, reproduziert die Signalreproduktionsschaltung 210 ein Signal x(n) gemäß der folgenden Gleichung:

Ein Schalter 220 gibt das Signal s(n) von der Signalreproduktionsschaltung 160 durch einen Ausgangsanschluß 230 in einem Sprachintervall aus, und gibt das Signal x(n) von der Signalreproduktionsschaltung 210 durch den Ausgangsanschluß 230 in einem Intervall ohne Sprache aus.

Die obige Berechnung durch die Gleichungen (5), (6) wird aus dem Grund durchgeführt, daß die Zufallszahlencodevektoren im Codebuch 200 normalisiert sind. Die Normalisierung macht die Verstärkungseinstellung nötig, wenn das Tonsignal aus dem ausgewählten Zufallszahlencodevektor reproduziert wird, und zwar für den Zweck, die Durchschnittsamplitude des reproduzierten Tonsignals der Signalreproduktionsschaltung 210 nahezu gleich demjenigen der Signalreproduktionsschaltung 160 im Intervall ohne Sprache zu machen.

Fig. 2 zeigt in Blockform einen Sprachdecodierer gemäß einem zweiten Ausführungsbeispiel der vorliegenden Erfindung. Diejenigen Teile, die in Fig. 2 gezeigt sind, die identisch zu denjenigen sind, die in Fig. 1 gezeigt sind, sind mit identischen Bezugszeichen bezeichnet und werden nachfolgend nicht detailliert beschrieben.

In Fig. 2 durchsucht eine Suchschaltung 250 das Codebuch 200 nach einem Codevektor cj(n), der die oben angegebene Gleichung (3) maximiert, und berechnet eine Verstärkung

wobei v(n) das Ausgangssignal von der Erregersignal-Erzeugungsschaltung 140 ist.

Die Suchschaltung 250 bestimmt weiterhin ein Tonquellensignal v'(n) gemäß der unten angegebenen Gleichung und gibt das bestimmte Tonquellensignal v'(n) zu einem Schalter 240 aus.

v'(n) = gj · cj(n) (10)

Der Schalter 240 gibt das Signal v(n) von der Erregersignal-Erzeugungsschaltung 140 in einem Sprachintervall zur Signalreproduktionsschaltung 260 aus und gibt das Signal v'(n) von der Suchschaltung 250 in einem Intervall ohne Sprache zur Signalreproduktionsschaltung 260 aus.

Bei diesem Ausführungsbeispiel ist die Konfiguration des Sprachdecodierers im Vergleich zum ersten Ausführungsbeispiel vereinfacht, obwohl die Genauigkeit einer Auswahl des Zufallszahlencodevektors, der einem ursprünglichen Geräusch am besten entspricht, ein klein wenig verschlechtert wird.

Fig. 3 zeigt in Blockform einen Sprachdecodierer gemäß einem dritten Ausführungsbeispiel der vorliegenden Erfindung. Diejenigen Teile, die in Fig. 3 gezeigt sind, die identisch zu denjenigen sind, die in Fig. 1 gezeigt sind, sind mit identischen Bezugszeichen bezeichnet und werden nachfolgend nicht detailliert beschrieben.

In Fig. 3 wird einer Unterdrückungsschaltung 300 das Ausgangssignal von der Spracherfassungsschaltung 120 zugeführt, und sie unterdrückt eine Durchschnittsamplitude r des Ausgangssignals von der Decodierschaltung 110 in einem Intervall ohne Sprache um einen vorbestimmten Betrag (z. B. 6 dB) und gibt darauffolgend das Signal zur Erregersignal-Erzeugungsschaltung 140 aus. Mit diesem Auf bau kann ein überlagertes Hintergrundgeräuschsignal in einem Intervall ohne Sprache unterdrückt werden.

Fig. 4 zeigt in Blockform einen Sprachdecodierer gemäß einem vierten Ausführungsbeispiel der vorliegenden Erfindung. Die in Fig. 4 gezeigten Teile, die identisch zu denjenigen sind, die in den Fig. 2 und 3 gezeigt sind, sind mit identischen Bezugszeichen bezeichnet und werden nachfolgend nicht detailliert beschrieben. Der in Fig. 4 gezeigte Sprachdecodierer ist eine Kombination aus den Sprachdecodierern gemäß dem zweiten und dem dritten Ausführungsbeispiel und arbeitet auf dieselbe Weise wie die Sprachdecodierer gemäß der Kombination aus dem zweiten und dem dritten Ausführungsbeispiel, d. h. die Unterdrückungsschaltung 300 ist auf der Eingangsseite der Erregersignal-Erzeugungsschaltung 140 des Sprachdecodierers in Fig. 2 vorgesehen.

Fig. 5 zeigt in Blockform einen Sprachdecodierer gemäß einem fünften Ausführungsbeispiel der vorliegenden Erfindung. Die in Fig. 5 gezeigten Teile, die identisch zu denjenigen sind, die in Fig. 1 gezeigt sind, sind mit identischen Bezugszeichen bezeichnet und werden nachfolgend nicht detailliert beschrieben.

In Fig. 5 unterzieht eine Aktualisierungs-Schaltung 320 im Codebuch 200 gespeicherte Zufallszahlencodevektoren bei vorbestimmten Zeitintervallen, z. B. Frame- Intervallen, einer Aktualisierung gemäß vorbestimmten Regeln, die diejenigen zum Andern von Referenzwerten zum Erzeugen von Zufallszahlen sein können. Alle oder einige der Codevektoren, die im Codebuch 200 gespeichert sind, können einer Aktualisierung unterzogen werden, und die Codevektoren können einer Aktualisierung unterzogen werden, wenn Intervalle ohne Sprache andauern, oder zu anderen Zeiten.

Mit der in Fig. 6 gezeigten Anordnung ist es möglich, Typen von Codevektoren im Zufallszahlencodebuch für eine größere Zufälligkeit zu erhöhen, so daß ein Hintergrund-Geräuschsignal in Intervallen ohne Sprache besser dargestellt werden kann. Der in Fig. 6 gezeigte Sprachdecodierer ist insbesondere dann effektiv, wenn die Anzahl von Bits des Zufallszahlencodevektors klein ist.

Fig. 6 zeigt in Blockform einen Sprachdecodierer gemäß einem sechsten Ausführungsbeispiel der vorliegenden Erfindung. Die in Fig. 6 gezeigten Teile, die identisch zu denjenigen sind, die in den Fig. 2 und 5 gezeigt sind, sind mit identischen Bezugszeichen bezeichnet und werden nachfolgend nicht detailliert beschrieben. Der in Fig. 6 gezeigte Sprachdecodierer ist eine Kombination aus den Sprachdecodierern gemäß dem zweiten und dem fünften Ausführungsbeispiel und arbeitet auf dieselbe Weise wie die Sprachdecodierer gemäß der Kombination aus dem zweiten und dem fünften Ausführungsbeispiel.

Bei den obigen Ausführungsbeispielen können die im Codebuch 200 gespeicherten Codevektoren Codevektoren mit einer anderen bekannten statistischen Natur sein. Der Spektrumsparameter kann ein anderer Parameter als LSP sein.

Mit der vorliegenden Erfindung, wie sie oben beschrieben ist, kann dann, wenn ein Hintergrundgeräusch einer Sprache überlagert ist, das Hintergrundgeräusch durch eine Signalverarbeitung nur im Sprachdecodierer selbst bei niedrigen Bitraten gut dargestellt werden und kann unterdrückt werden.

Es ist jedoch zu verstehen, daß, obwohl die Eigenschaften und Vorteile der vorliegenden Erfindung in der vorangehenden Beschreibung aufgezeigt worden sind, die Offenbarung nur illustrativ ist, und daß Änderungen in bezug auf die Form, die Größe und den Aufbau von den Teilen durchgeführt werden können.


Anspruch[de]

1. Sprachdecodierer, der folgendes aufweist:

eine Decodiereinrichtung (110) zum Decodieren eines binären codierten Eingangssignals in einen spektralen Parameter, eine Durchschnittsamplitude, eine Abstandsperiode und ein Tonquellensignal;

eine Spracherfassungseinrichtung (120) zum Erfassen eines Intervalls ohne Sprache und eines Sprachintervalls unter Verwendung von wenigstens einem von dem spektralen Parameter, der Durchschnittsamplitude und der Abstandsperiode;

eine Erregersignal-Erzeugungseinrichtung (140) zum Erzeugen eines Erregersignals unter Verwendung des Tonquellensignals, der Durchschnittsamplitude und der Abstandsperiode;

eine erste Signalreproduktionseinrichtung (160) zum Reproduzieren eines Tonsignals unter Verwendung des Erregersignals von der Erregersignal- Erzeugungseinrichtung und des spektralen Parameters von der Decodiereinrichtung;

eine Speichereinrichtung zum Speichern eines Zufallszahlencodebuchs (200), das Zufallszahlencodevektoren speichert, die beim Reproduzieren von Tonsignalen verwendet werden können;

eine Sucheinrichtung (180) zum Durchsuchen des Zufallszahlencodebuchs (200) und zum Auswählen eines Zufallszahlencodevektors, der zum Reproduzieren eines Tonsignals verwendet werden kann, das dem Ausgangssignal am nächsten ist, das im Intervall ohne Sprache durch die erste Signalreproduktionseinrichtung reproduziert wird;

eine zweite Signalreproduktionseinrichtung (210) zum Reproduzieren eines Tonsignals unter Verwendung des spektralen Parameters von der Decodiereinrichtung und des Zufallszahlencodevektors, der durch die Sucheinrichtung gesucht worden ist; und

eine Schalteinrichtung (220) zum Ausgeben des Tonsignals von der ersten Signalreproduktionseinrichtung im Sprachintervall oder zum Ausgeben des Tonsignals von der zweiten Signalreproduktionseinrichtung im Intervall ohne Sprache.

2. Sprachdecodierer nach Anspruch 1, wobei die Sucheinrichtung (180) eine Verstärkung berechnet, die durch die zweite Signalreproduktionseinrichtung (210) zum Einstellen einer Durchschnittsamplitude des Tonsignals verwendet wird, das aus dem ausgewählten Zufallszahlencodevektor reproduziert wird, so daß die Amplitude der Tonsignale der ersten und der zweiten Signalreproduktionseinrichtung (160, 210) im Intervall ohne Sprache nahezu gleich wird.

3. Sprachdecodierer nach Anspruch 1, wobei die Erregersignal- Erzeugungseinrichtung (140) eine Unterdrückungseinrichtung zum Unterdrücken der Durchschnittsamplitude im Intervall ohne Sprache aufweist.

4. Sprachdecodierer nach Anspruch 2, wobei die Erregersignal- Erzeugungseinrichtung eine Unterdrückungseinrichtung zum Unterdrücken der Durchschnittsamplitude im Intervall ohne Sprache aufweist.

5. Sprachdecodierer nach Anspruch 2, wobei die Sucheinrichtung (180) eine Aktualisierungs-Einrichtung (320) zum Aktualisieren des Zufallszahlencodebuchs (200) bei einem vorbestimmten Zeitintervall aufweist.

6. Sprachdecodierer, der folgendes aufweist:

eine Decodiereinrichtung (110) zum Decodieren eines binären codierten Eingangssignals in einen spektralen Parameter, eine Durchschnittsamplitude, eine Abstandsperiode und ein Tonquellensignal;

eine Spracherfassungseinrichtung (120) zum Erfassen eines Intervalls ohne Sprache und eines Sprachintervalls unter Verwendung von wenigstens einem von dem spektralen Parameter, der Durchschnittsamplitude und der Abstandsperiode;

eine Erregersignal-Erzeugungseinrichtung (140) zum Erzeugen eines Erregersignals unter Verwendung des Tonquellensignals, der Durchschnittsamplitude und der Abstandsperiode;

eine Speichereinrichtung zum Speichern eines Zufallszahlencodebuchs (200), das Zufallszahlencodevektoren speichert, die beim Reproduzieren von Tonsignalen verwendet werden können;

eine Sucheinrichtung (250) zum Durchsuchen des Zufallszahlencodebuchs (200) nach einem Zufallszahlencodevektor, der beim Reproduzieren eines Tonsignals verwendet werden kann, das im Intervall ohne Sprache dem Erregersignal am nächsten ist;

eine Schalteinrichtung (240) zum Ausgeben des Erregersignals von der Erregersignal-Erzeugungseinrichtung (140) im Sprachintervall oder zum Ausgeben des Zufallszahlencodevektors, der im Intervall ohne Sprache durch die Sucheinrichtung (250) gesucht worden ist; und

eine Signalreproduktionseinrichtung (260) zum Reproduzieren eines Tonsignals unter Verwendung des spektralen Parameters von der Decodiereinrichtung (110) und der Ausgabe von der Schalteinrichtung (240).

7. Sprachdecodierer nach Anspruch 6, wobei die Sucheinrichtung (250) eine Verstärkung berechnet, die durch die Signalreproduktionseinrichtung zum Einstellen einer Durchschnittsamplitude des Tonsignals verwendet wird, das von dem ausgewählten Zufallszahlencodevektor reproduziert wird, so daß das Erregersignal und der durch die Sucheinrichtung (250) ausgewählte Zufallszahlencodevektor im Intervall ohne Sprache nahezu gleich wird.

8. Sprachdecodierer nach Anspruch 6, wobei die Erregersignal- Erzeugungseinrichtung (140) eine Unterdrückungseinrichtung zum Unterdrücken der Durchschnittsamplitude im Intervall ohne Sprache aufweist.

9. Sprachdecodierer nach Anspruch 7, wobei die Erregersignal- Erzeugungseinrichtung (140) eine Unterdrückungseinrichtung zum Unterdrücken der Durchschnittsamplitude im Intervall ohne Sprache aufweist.

10. Sprachdecodierer nach Anspruch 7, wobei die Sucheinrichtung eine Einrichtung (320) zum Aktualisieren des Zufallszahlencodebuchs (200) bei einem vorbestimmten Zeitintervall aufweist.







IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com