PatentDe  


Dokumentenidentifikation DE69732870T2 06.04.2006
EP-Veröffentlichungsnummer 0000784312
Titel System zur Kodierung und Dekodierung von Audiosignalen
Anmelder NEC Corp., Tokio/Tokyo, JP
Erfinder Iwadare, Masahiro, Minato-ku, Tokyo, JP;
Takamizawa, Yuichiro, Minato-ku, Tokyo, JP
Vertreter Betten & Resch, 80333 München
DE-Aktenzeichen 69732870
Vertragsstaaten DE, FR, GB, IT, NL, SE
Sprache des Dokument EN
EP-Anmeldetag 07.01.1997
EP-Aktenzeichen 971001300
EP-Offenlegungsdatum 16.07.1997
EP date of grant 30.03.2005
Veröffentlichungstag im Patentblatt 06.04.2006
IPC-Hauptklasse G10L 19/00(2006.01)A, F, I, 20051017, B, H, EP

Beschreibung[de]
Hintergrund der Erfindung 1. Gebiet der Erfindung

Die vorliegende Erfindung bezieht sich auf ein System zum effektiven Codieren und Decodieren eines Sprachsignals, eines Audiosignals usw.

2. Beschreibung des Stands der Technik

In einem digitalen Codiersystem für ein Sprachsignal, für ein Audiosignal usw. wird die Signalübertragungsrate oder -aufzeichnungsrate verringert, wenn seine Redundanz entfernt wird. Als eine Referenz des Stands der Technik wird anhand der 3 und 4 ein Codiersystem beschrieben, das in ISO/IEC (International Organisation for Standardisation/International Electro-technical Commission) 11172-3 (als MPEG/Audio bezeichnet), Schicht I, definiert ist.

Ein in 3 gezeigter herkömmlicher Codierer ist aus einem Eingabeanschluss 1, einem Signalkonvertierungsabschnitt 2, einem Analysierabschnitt 3, einem Auswahlabschnitt 4, Quantisierungsabschnitten 51 bis 53, einem Multiplexabschnitt 6 und einem Ausgabeanschluss 7 gebildet. Die Quantisierungsabschnitte 51 bis 53 unterscheiden sich voneinander in Bezug auf die Anzahl der Quantisierungsschritte. In diesem Beispiel besitzt der Quantisierungsabschnitt 51 drei Quantisierungsschritte. Der Quantisierungsabschnitt 52 besitzt sieben Quantisierungsschritte. Der Quantisierungsabschnitt 53 besitzt 15 Quantisierungsschritte. In dem Literaturhinweis des verwandten Gebiets sind Quantisierungsabschnitte mit mehr als 15 Schritten vorgesehen, wobei sie aber in diesem Dokument zur Vereinfachung weggelassen sind.

Dieses System basiert auf einem Teilbandcodiersystem, bei dem ein Eingabesignal in eine Vielzahl von Frequenzdomänensignalen unterteilt wird und jedes Frequenzdomänensignal unabhängig codiert wird. Allgemein haben Sprach- und Audiosignale bei niedrigerer Frequenz höhere Amplituden, wobei die erforderliche Rate zur Übertragung dadurch verringert werden kann, dass bei niedrigerer Frequenz mehr Bits zugewiesen werden, während bei höherer Frequenz weniger Bits zugewiesen werden.

In der Realität wird von dem Eingabeanschluss 1 ein digitales Audiosignal, z. B. PCM-Audioabtastwerte, geliefert. Jedes Mal, wenn 32 Abtastwerte des Audiosignals eingegeben werden, unterteilt der Signalkonvertierungsabschnitt 2 die Frequenzbänder des Eingabeaudiosignals und konvertiert sie in 32 Frequenzdomänensignale. Außerdem speichert der Signalkonvertierungsabschnitt 2 12 Sätze von Frequenzdomänensignalen in einem Puffer davon, da die durch eine Konversion erhaltenen 32 Frequenzdomänensignale ein Satz von Frequenzdomänensignalen ist. Die 12 Sätze von Frequenzdomänensignalen mit der gleichen Frequenz werden als ein Block bezeichnet (32 × 12 = 384 Abtastwerte/Rahmen).

Der Analysierabschnitt 3 berechnet in jedem Frequenzband einen erlaubten Fehler beim Quantisieren der Frequenzdomänensignale. Wenn z. B. beim Bewerten der Codierungsqualität ein objektives S/N-Verhältnis verwendet wird, wird der erlaubte Fehler für jedes Frequenzdomänensignal konstant gehalten. Wenn ein Audiosignal codiert wird, wird nicht nur ein objektiver Wert wie etwa das S/N-Verhältnis, sondern eine subjektive Bewertung wie etwa durch Testhören stark beachtet. Somit kann das Codierungsrauschen unter Verwendung psychoakustischer Analysetechnologien gesteuert werden, so dass die Verschlechterung der Hörqualität des wiedergegebenen Klangs minimiert wird. Folglich sollte basierend auf dem Eingabeaudiosignal und/oder den Frequenzdomänensignalen der erlaubte Fehler erhalten werden.

Der Auswahlabschnitt 4 wählt einen der Quantisierungsabschnitte 51 bis 53 aus, der die Frequenzdomänensignale für jeden Block quantisiert.

Jeder der Quantisierungsabschnitte 51 bis 53 empfängt einen Block von Frequenzdomänensignalen, berechnet die Amplitudeninformationen der Frequenzdomänensignale jedes Blocks, codiert die Frequenzdomänensignale mit den Amplitudeninformationen und gibt die Amplitudeninformationen und die Codes der codierten Frequenzdomänensignale aus. Die Amplitudeninformationen werden wie in Tabelle 1 gezeigt mit einer Genauigkeit von 2 dB erhalten.

[Tabelle 1] Beziehung zwischen Index und Amplitude

In der Realität erfasst jeder der Quantisierungsabschnitte 51 bis 53 den maximalen Amplitudenabsolutwert der Frequenzdomänensignale in jedem Block und behandelt den aufgerundeten Wert mit der Genauigkeit von 2 dB als Amplitudeninformationen. In diesem Standard werden 63 Amplitudeninformationsindizes bereitgestellt. Um die Amplitudeninformationen zu senden, sind sechs Bits erforderlich.

In diesem Standard ist die Quantisierungscharakteristik linear. Unter der Annahme, dass der Betragswert eines Frequenzdomänensignals C ist, der Wert der Amplitudeninformationen L ist und die Anzahl der Quantisierungsschritte S ist, wobei die Koeffizienten A und B die Anzahl der Quantisierungsschritte S in Tabelle 2 entsprechen, wird [{A × (C/L) + B} × (S + 1)/2] berechnet. Die Bruchteile nach dem Dezimalkomma des berechneten Ergebnisses werden aufgerundet und die signifikanten höherwertigen N Bits erhalten. Anschließend wird durch Invertieren des höchstwertigen Bits der N Bits ein Code des Frequenzdomänensignals erhalten.

[Tabelle 2] Beziehung zwischen der Anzahl der Quantisierungsschritte S, den Koeffizienten A und B und den Bits N

In einem Dequantisierungsabschnitt einer in 4 gezeigten Decodiervorrichtung wird das höchstwertige Bit des Codes invertiert und ein Ergebnis Q erhalten. Durch Berechnen von [{2 × (Q + 1)/S} × L] kann ein dequantisiertes Signal des Frequenzdomänensignals erhalten werden.

Nachfolgend werden reale Quantisierungs- und Dequantisierungsprozesse in dem Fall beschrieben, dass die Amplitudenwerte der Frequenzdomänensignale eines Blocks 0,10, –0,15, –0,03, 0,20, 0,05, 0,44, 0,05, –0,11, 0,32, –0,40, 0,92 und 0,04 sind.

Da der maximale Amplitudenwert in diesem Block 0,92 ist, wird als der Amplitudenwert 1,0 (Index = 3) ausgewählt. Entsprechend der oben beschriebenen Berechnung sind die in dem 15-Schritt-Quantisierungsprozess erhaltenen Codes 8, 6, 7, 9, 7, 10, 7, 6, 9, 4, 14 und 7. Der Dequantisierungsabschnitt dequantisiert diese Codes und erhält 0,133, –0,133, 0,0, 0,267, 0,0, 0,4, 0,0, –0,133, 0,267, –0,400, 0, 933 und 0, 0.

Die 15-Schritt-Quantisierungseinheit 53 benötigt zum Senden eines Codes eines Frequenzdomänensignals vier Bits. Somit benötigt die 15-Schritt-Quantisierungseinheit 53 zum Senden der Codes von 12 Frequenzdomänensignalen eines Blocks 48 Bits. Außerdem benötigt die 15-Schritt-Quantisierungseinheit 53 zum Senden der Amplitudeninformationen sechs Bits. Somit benötigt die 15-Schritt-Quantisierungseinheit 53 insgesamt 54 Bits.

Wenn der Quantisierungsabschnitt-Auswahlabschnitt 4 die Drei-Schritt-Quantisierungsabschnitte auswählt, werden die Codes 1, 1, 1, 1, 1, 2, 1, 1, 1, 0, 2 und 1 erhalten. Die dequantisierten Werte sind 0,0, 0,0, 0,0, 0,0, 0,0, 0,667, 0,0, 0,0, 0,0, –0,667, 0,667 und 0,0.

Somit ist die Gesamtzahl der zum Senden eines Blocks erforderlichen Bits insgesamt 30 Bits, die aus 12 Zwei-Bit-Codes, von denen jeder einen auf drei Niveaus quantisierten Wert jedes Frequenzdomänensignals repräsentiert, und sechs Bits, die die Amplitudeninformationen des Blocks repräsentieren, gebildet sind.

Wie bei der Dequantisierungsberechnung ist der Betrag des Quantisierungsfehlers proportional zu {(Amplitudenwert L)/(Anzahl der Quantisierungsschritte S)} jedes Blocks. Somit kann die Quantisierungsgenauigkeit der Frequenzdomänensignale verbessert werden, während die Anzahl der Quantisierungsschritte S groß ist. Allerdings wird die Anzahl der Bits N, die jeden Code repräsentieren, groß, wenn die Anzahl der Quantisierungsschritte S groß wird. Somit steigt die Übertragungsrate. Während der Quantisierungsabschnitt-Auswahlabschnitt 4 den Betrag des Quantisierungsfehlers jedes Frequenzdomänensignals in der Weise einstellt, dass er proportional zu dem durch den Analysierabschnitt 3 definierten erlaubten Fehler ist, wählt folglich der Quantisierungsabschnitt-Auswahlabschnitt 4 einen Quantisierungsabschnitt in der Weise aus, dass die Anzahl der zum Codieren aller Frequenzdomänensignale erforderlichen Bits in einer Domäne liegt, die der Übertragungsrate entspricht.

Der Multiplexabschnitt 6 multiplexiert die Quantisierungsabschnitt-Auswahlinformationen und eine Ausgabe eines Quantisierungsabschnitts für jeden Block, bildet einen Bitstrom und liefert ihn über den Ausgabeanschluss 7.

Die herkömmliche Decodiervorrichtung ist aus einem Eingabeanschluss 11, einem Demultiplexierungsabschnitt 12, einem Drei-Schritt-Dequantisierungsabschnitt 81, einem Sieben-Schritt-Dequantisierungsabschnitt 82, einem 15-Schritt-Dequantisierungsabschnitt 83, einem Abschnitt 13 für inverse Signalkonvertierung und einem Ausgabeanschluss 14 gebildet.

Die Decodiervorrichtung empfängt von dem Eingabeanschluss 11 ein multiplexiertes Signal. Der Demultiplexierungsabschnitt 12 demultiplexiert das multiplexierte Signal in Quantisierungsabschnitt-Auswahlinformationen und in eine Ausgabe eines Quantisierungsabschnitts. Mit den Quantisierungsabschnitt-Auswahlinformationen wird aus dem Drei-Schritt-Dequantisierungsabschnitt 81, aus dem Sieben-Schritt-Dequantisierungsabschnitt 82 und aus dem 15-Schritt-Dequantisierungsabschnitt 83 ein Dequantisierungsabschnitt ausgewählt, der dem Quantisierungsverfahren auf der Codierungsseite entspricht. Jeder der Dequantisierungsabschnitte 81 bis 83 trennt die Ausgabe eines Quantisierungsabschnitts in Amplitudeninformationen und Codes der Frequenzdomänensignale. Wie oben beschrieben wurde, werden die Codes der Frequenzdomänensignale mit den Amplitudeninformationen dequantisiert und die Frequenzdomänensignale jedes Blocks reproduziert. Der Abschnitt 13 für inverse Signalkonvertierung konvertiert die Frequenzdomänensignale invers in ein Zeitdomänensignal und liefert das resultierende Signal über den Ausgabeanschluss 14.

In der Referenz des Stands der Technik wird ein Quantisierungsabschnitt verwendet, der mit einem Block gemeinsam ist. Somit wird die Verteilung der quantisierten Codes unregelmäßig, wobei sich die Codierungseffizienz verschlechtert, wenn die Amplitudenverteilung der Frequenzdomänensignale nicht gleich ist, wenn z. B. wenige Frequenzdomänensignale in dem Block große hervorstehende Amplituden haben.

Zusammenfassung der Erfindung

Eine Aufgabe der vorliegenden Erfindung ist die Schaffung eines Systems zum Konvertieren eines Schall- und Sprachsignals in Frequenzdomänensignale zum Bilden von Blöcken und zum Unterdrücken der Anzahl der Quantisierungsbits, um eine hohe Codierungsqualität zu erreichen, falls wenige Frequenzdomänensignale in den Blöcken hervorstehende Amplituden haben.

Die vorliegende Erfindung ist ein Codiersystem, wie es in Anspruch 1 definiert ist.

In dem Codiersystem gemäß der vorliegenden Erfindung sind die Ausgaben des zweiten Quantisierungsabschnitts eine Amplitudeninformationen, ein Polaritätscode und ein Index.

In dem Codiersystem gemäß der vorliegenden Erfindung sind die Ausgaben des zweiten Quantisierungsabschnitts eine repräsentative Amplitudeninformation, eine Vielzahl von Frequenzindizes und eine Vielzahl von Polaritätscodes.

In dem Codiersystem gemäß der vorliegenden Erfindung werden die Signalindizes bei der Bestimmung eines Teils der Frequenzdomänensignale des in dem zweiten Quantisierungsabschnitt zu codierenden Blocks zuvor in Gruppen unterteilt, wobei aus jeder der Gruppen nur ein Index auswählbar ist.

Außerdem ist die vorliegende Erfindung ein Decodiersystem, wie es in Anspruch 6 definiert ist.

In dem Decodiersystem gemäß der vorliegenden Erfindung sind die Eingaben des zweiten Dequantisierungsabschnitts Amplitudeninformationen, ein Polaritätscode und ein Index.

In dem Decodiersystem gemäß der vorliegenden Erfindung sind die Eingaben des zweiten Dequantisierungsabschnitts eine repräsentative Amplitudeninformation, eine Vielzahl von Frequenzindizes und eine Vielzahl von Polaritätscodes.

In dem Decodiersystem gemäß der vorliegenden Erfindung werden die Signalindizes zuvor durch den zweiten Dequantisierungsabschnitt dividiert, wobei nur ein Index in jeder der Gruppen eines Frequenzdomänensignals decodiert werden kann.

Frequenzdomänensignale mit großen hervorstehenden Amplituden werden mit Amplitudeninformationen, Polaritätsinformationen und Signalindex quantisiert/dequantisiert.

Diese und weitere Aufgaben, Merkmale und Vorteile der vorliegenden Erfindung werden im Licht der folgenden ausführlichen Beschreibung einer besten Ausführungsart davon, wie sie in der beigefügten Zeichnung gezeigt ist, besser sichtbar.

Kurzbeschreibung der Zeichnung

1 ist ein Blockschaltplan, der ein Codiersystem gemäß der vorliegenden Erfindung zeigt;

2 ist ein Blockschaltplan, der ein Decodiersystem gemäß der vorliegenden Erfindung zeigt;

3 ist ein Blockschaltplan, der ein herkömmliches Codiersystem zeigt; und

4 ist ein Blockschaltplan, der ein herkömmliches Decodiersystem zeigt.

Beschreibung einer bevorzugten Ausführungsform

Anhand der 1 und 2 wird eine Ausführungsform der vorliegenden Erfindung beschrieben. In der Ausführungsform sind vier Arten von Quantisierungsabschnitten und vier Arten von Dequantisierungsabschnitten verwendet. Allerdings wird angemerkt, dass die Anzahl der Arten sowohl der Quantisierungsabschnitte als auch der Dequantisierungsabschnitte nicht beschränkt ist.

Eine Codiervorrichtung gemäß der vorliegenden Erfindung ist aus einem Eingabeanschluss 1, einem Signalkonvertierungsabschnitt 2, einem Analysierabschnitt 3, einem Auswahlabschnitt 4, Quantisierungsabschnitten 50 bis 53, einem Multiplexabschnitt 6 und einem Ausgabeanschluss 7 gebildet. Die Quantisierungsabschnitte 50 bis 53 sind aus einem Pulsquantisierungsabschnitt 50 sowie aus einem Drei-Schritt-Quantisierungsabschnitt 51, einem Sieben-Schritt-Quantisierungsabschnitt 52 und einem 15-Schritt-Quantisierungsabschnitt 53 gebildet, die die gleichen sind wie jene, die in der herkömmlichen Codiervorrichtung verwendet sind.

Von dem Eingabeanschluss 1 wird ein digitales Audiosignal, z. B. PCM-Audioabtastwerte, geliefert. Jedes Mal, wenn 32 Abtastwerte eines Audiosignals eingegeben werden, konvertiert der Signalkonvertierungsabschnitt 2 ein Band des Audiosignals in 32 Frequenzdomänensignale und speichert 12 Sätze von Frequenzdomänensignalen, da 32 Frequenzdomänensignale ein Satz von Frequenzdomänensignalen sind. Diese 12 Sätze von Frequenzdomänensignalen jeder Frequenz bilden einen Block. Als ein Signalkonvertierungsprozess können eine Vielzahl konvertierter Koeffizienten mit aufeinander folgenden Frequenzindizes durch einen Fourier-Transformationsprozess oder durch einen diskreten Kosinustransformationsprozess anstelle des Bandunterteilungsprozesses als ein Block gruppiert werden.

Der Analysierabschnitt 3 berechnet unter Verwendung des Eingabeaudiosignals, der Frequenzdomänensignale usw. in der gleichen Weise wie im herkömmlichen Verfahren für jede Frequenz den Betrag des erlaubten Fehlers.

Während der Auswahlabschnitt 4 die Größe des Quantisierungsfehlers jedes Frequenzdomänensignals in der Weise einstellt, dass er proportional zu dem durch den Analysierabschnitt 3 definierten erlaubten Fehler ist, wählt der Auswahlabschnitt 4 einen Quantisierungsabschnitt in der Weise aus, dass die Anzahl der für die Codierung der Frequenzdomänensignale aller Blöcke erforderlichen Bits in einem erlaubten Bereich liegt, der der Übertragungsrate entspricht. Wie später beschrieben wird, codiert der ausgewählte Quantisierungsabschnitt das Frequenzdomänensignal jedes Blocks.

Der Multiplexabschnitt 6 multiplexiert die Quantisierungsabschnitt-Auswahlinformationen und die Ausgabe eines Quantisierungsabschnitts für jeden Block, bildet einen Bitstrom und liefert ihn über den Ausgabeanschluss 7.

Eine Decodiervorrichtung gemäß der vorliegenden Erfindung ist aus einem Eingabeanschluss 11, einem Demultiplexierungsabschnitt 12, einem Impulsdequantisierungsabschnitt 80, einem Drei-Schritt-Dequantisierungsabschnit 81, einem Sieben-Schritt-Dequantisierungsabschnitt 82, einem 15-Schritt-Dequantisierungsabschnitt 83, einem Abschnitt 13 für inverse Signalkonvertierung und einem Ausgabeanschluss 14 gebildet.

Von dem Eingabeanschluss 11 wird ein multiplexiertes Signal empfangen. Der Demultiplexierungsabschnitt 12 demultiplexiert das empfangene Signal in den Auswahlabschnitt und eine Ausgabe eines Quantisierungsabschnitts. Mit den Auswahlinformationen wird aus dem Impulsdequantisierungsabschnitt 80, aus dem Drei-Schritt-Dequantisierungsabschnitt 81, aus dem Sieben-Schritt-Dequantisierungsabschnitt 82 und aus dem 15-Schritt-Dequantisierungsabschnitt 83 ein Dequantisierungsabschnitt auswählt, der dem Quantisierungsverfahren auf der Codierungsseite entspricht. Wie später beschrieben wird, reproduziert der ausgewählte Dequantisierungsabschnitt die Frequenzdomänensignale jedes Blocks, der der Eingabe des Quantisierungsabschnitts entspricht. Der Abschnitt 13 für inverse Signalkonvertierung konvertiert die Frequenzdomänensignale invers in eine Zeitdomäne und liefert das resultierende Signal über den Ausgabeanschluss 14.

Nachfolgend werden mehrere Beispiele des Quantisierungsprozesses und des Dequantisierungsprozesses gemäß der vorliegenden Erfindung beschrieben.

Als ein erstes Beispiel codiert der Pulsquantisierungsabschnitt 80 die Frequenzdomänensignale mit großen hervorstehenden Amplitudenwerten, wenn die Frequenzdomänensignale jedes Blocks codiert werden. Die herkömmlichen Quantisierungsabschnitte codieren andere Frequenzdomänensignale. In dem Beispiel des Literaturhinweises des verwandten Gebiets quantisiert der Pulsquantisierungsabschnitt 50 das 11-te Teilbandsignal mit einem Amplitudenwert 0,92. Die herkömmlichen Quantisierungsabschnitte quantisieren andere Frequenzdomänensignale mit den Amplitudenwerten 0,10, –0,15, –0,03, 0,20, 0,05, 0,44, 0,05, –0,11, 0,32, –0,40 und 0,04.

Der Pulsquantisierungsabschnitt 50 berechnet den Amplitudenwert, die Polarität und den Index eines Teilbandsignals und gibt sie aus. Falls der Pulsquantisierungsabschnitt 50 ein Frequenzdomänensignal mit einem Amplitudenwert 0,92 verarbeitet, gibt der Pulsquantisierungsabschnitt 50 die Amplitudeninformation 1,0 (Index = 3) und die Polaritätsinformation positiv aus, wenn die in Tabelle 1 gezeigte Beziehung zwischen Index und Amplitudeninformationen angewendet wird. Da das Frequenzdomänensignal mit dem Amplitudenwert 0,92 an der 11-ten Stelle des Blocks angeordnet ist, ist die Indexinformation 11. Somit erfordert die Ausgabe des Pulsquantisierungsabschnitts 50 sechs Bits für die Amplitudeninformationen, ein Bit für die Polaritätsinformationen und vier Bits für die Frequenzindexinformationen, die 12 Signale des Blocks identifizieren. Da Frequenzdomänensignale mit großen hervorstehenden Amplitudenwerten ausgeschlossen sind, wird der maximale Amplitudenabsolutwert anderer Frequenzdomänensignale von 0,92 auf 0,44 verringert. Somit werden die Amplitudeninformationen dieser Frequenzdomänensignale zu 0,5 (Index = 6). Da der Quantisierungsfehler proportional zu {(Amplitudenwert L)/(Anzahl der Quantisierungsschritte S)} jedes Blocks ist, kann die Anzahl der erforderlichen Schritte von 15 auf 7 verringert werden, wenn die Frequenzdomänensignale mit dem ähnlichen Quantisierungsfehler wie jene des 15-Schritt-Quantisierungsabschnitts und des 15-Schritt-Dequantisierungsabschnitts quantisiert werden. Somit kann die Anzahl der zum Senden jedes Codes erforderlichen Bits von 4 auf 3 verringert werden. Der Sieben-Schritt-Quantisierungsabschnitt quantisiert die 11 Teilbandsignale und erhält die Codes 4, 2, 3, 4, 3, 6, 3, 2, 5, 0 und 3. Auf der Decodierungsseite decodiert der Sieben-Schritt-Dequantisierungsabschnitt 82 diese Codes und erhält die reproduzierten Frequenzdomänensignale 0,143, –0,143, 0,0, 0,143, 0,0, 0,429, 0,0, –0,143, 0,286, –0,429 und 0,0.

Schließlich können gemäß der vorliegenden Erfindung wie in Tabelle 3 gezeigt bei insgesamt 50 Bits die Codes aller Frequenzdomänensignale eines Blocks gesendet werden. Im Vergleich zu den 54 Bits des Literaturhinweises des verwandten Gebiets kann die Anzahl der erforderlichen Bits um vier Bits verringert werden.

[Tabelle 3] Bitzuweisung

Nachfolgend werden der Pulsquantisierungsprozess und der Pulsdequantisierungsprozess mit dem Eingabesignal des Literaturhinweises des verwandten Gebiets beschrieben, falls die Anzahl der Quantisierungsschritte 3 ist.

Wenn die Anzahl der Quantisierungsschritte in einem Block drei ist, sind die Amplitudenwerte der quantisierten Frequenzdomänensignale "0" und "±" (die gleichen oder negativen Werte des Werts, der durch die Amplitudeninformationen angegeben wird). Mit anderen Worten, wenn Impulse mit negativen und positiven Amplitudenwerten mit einer Mitte von "0" angeordnet sind, können Frequenzdomänensignale des Blocks repräsentiert werden. Die zu sendenden Informationen sind Amplitudeninformationen gemeinsam mit Frequenzdomänensignalen des Blocks, ein Frequenzindex jedes mit einem Impuls imitierten Frequenzdomänensignals und ein Polaritätscode.

Da die Frequenzdomänensignale eines Blocks in dem Beispiel des Eingabesignals des Literaturhinweises des verwandten Gebiets mit drei Impulsen imitiert werden können, ist in Tabelle 4 eine Bitzuweisung gezeigt, wenn die Anzahl der in einem Block repräsentierten Frequenzdomänensignale auf vier beschränkt ist. Da die mit Impulsen imitierten Frequenzdomänensignale 6 (0,44), 10 (–0,40) und 11 (0,92) sind, werden die Informationen 6, 10 und 11 als Indizes codiert. Die Polaritäten dieser Codes sind positiv, negativ und positiv. Als Amplitudeninformationen werden 1,0 (Index = 3) als der Maximalamplitudenwert oder 0,630 (Index = 5) als der Durchschnitt der Amplitudenwerte der drei zu imitierenden Frequenzdomänensignale verwendet.

[Tabelle 4] Bitzuweisung

Die Anzahl der Bits für die Amplitudeninformationen, für den Index und für den Polaritätscode sind sechs, vier und eins. Somit ist die Gesamtzahl der Bits 23 Bits, d. h. weniger als 30 Bits in der Referenz zum Stand der Technik.

Wenn die Anzahl der Bits der Anzahlinformationen der zu codierenden Frequenzdomänensignale auf eins, zwei, drei oder vier geändert wird, können bis zu zwei, vier, acht und 16 Frequenzdomänensignale imitiert werden. Unter der Annahme, dass die Anzahl der zu imitierenden Frequenzdomänensignale M und die Anzahl der Bits für die Anzahlinformationen der zu codierenden Frequenzdomänensignale N ist (N = 1 bis 4), kann die Anzahl der erforderlichen Bits durch 6 + N + M × (4 + 1) ausgedrückt werden. Somit ist die Anzahl der benötigten Bits, wenn die Anzahl der in einem Rahmen repräsentierten Frequenzdomänensignale auf vier begrenzt ist, im Vergleich zu dem Literaturhinweis des verwandten Gebiets, in dem ein Drei-Schritt-Quantisierungsprozess verwendet wird, immer verringert.

Falls der Pulsquantisierungsprozess und der Pulsdequantisierungsprozess verwendet werden, kann die Anzahl der Bits verringert werden, wenn die Auswahl der zu codierenden Frequenzdomänensignale beschränkt wird. Zum Beispiel werden Beschränkungen dessen angewendet, welche 12 Frequenzdomänensignale eines Blocks in drei Gruppen unterteilt werden, wobei nur ein Frequenzdomänensignal jeder Gruppe codiert wird. Als ein Gruppierungsverfahren werden das erste, das vierte, das siebente und das zehnte Frequenzdomänensignal der ersten Gruppe zugewiesen. Das zweite, das fünfte, das achte und das elfte Frequenzdomänensignal werden der zweiten Gruppe zugewiesen. Das dritte, das sechste, das neunte und das elfte Frequenzdomänensignal werden der dritten Gruppe zugewiesen. Als ein Kriterium für die Auswahl eines Frequenzdomänensignals aus jeder Gruppe wird ein Amplitudenwert verwendet.

In dem Beispiel der Frequenzdomänensignale des Literaturhinweises des verwandten Gebiets ist das Frequenzdomänensignal mit dem größten Amplitudenabsolutwert der ersten Gruppe das zehnte Frequenzdomänensignal (–0,40). Das Frequenzdomänensignal mit dem größten Amplitudenabsolutwert der zweiten Gruppe ist das elfte Frequenzdomänensignal (0,92). Das Frequenzdomänensignal mit dem größten Amplitudenabsolutwert der dritten Gruppe ist das sechste Frequenzdomänensignal (0,44). In den Frequenzdomänensignalen, die den einzelnen Gruppen zugewiesen sind, haben das vierte Frequenzdomänensignal, das vierte Frequenzdomänensignal und das zweite Frequenzdomänensignal die größten Amplitudenwerte. Somit können die Frequenzdomänensignale an dem decodierenden Standort reproduziert werden, wenn außer den Amplitudeninformationen 4, 4 und 2 als die Indizes der ausgewählten Frequenzdomänensignale und negativ, positiv und positiv als die Polaritätsinformationen gesendet werden. Wie bei dem oben beschriebenen Beispiel werden an diesem Punkt 1,0 (Index = 3), basierend auf dem maximalen Amplitudenwert, oder 0,630 (Index = 5), basierend auf dem Durchschnittswert der Amplitudenwerte von drei zu imitierenden Frequenzdomänensignalen, als der Amplitudenwert verwendet.

Wie in Tabelle 5 gezeigt ist, ist die Anzahl der Bits, die zum Senden von Frequenzdomänensignalen eines Blocks erforderlich sind, sechs Bits für die Amplitudeninformationen des Blocks, zwei Bits für einen Index zum Auswählen eines von vier Frequenzdomänensignalen und ein Bit zum Repräsentieren der Polarität der Amplitude des ausgewählten Frequenzdomänensignals. Da insgesamt 15 Bits verwendet werden, ist somit die Anzahl der erforderlichen Bits im Vergleich zu der oben beschriebenen Ausführungsform verringert.

[Tabelle 5] Bitzuweisung

Als ein Gruppierungsverfahren zum Gruppieren der Frequenzdomänensignale eines Blocks können das erste, das zweite, das dritte und das vierte Signal der ersten Gruppe zugewiesen werden. Das fünfte, das sechste, das siebente und das achte Signal können der zweiten Gruppe zugewiesen werden. Das neunte, das zehnte, das elfte und das zwölfte Frequenzdomänensignal können der dritten Gruppe zugewiesen werden.

In der oben beschriebenen Ausführungsform wurde beispielhaft ein Audiosignal erläutert. Allerdings wird angemerkt, dass ein Videosignal mit einer hervorstehenden Farbdichte oder mit einer größten Farbe mit einem Pulsquantisierungsabschnitt und mit einem Pulsdequantisierungsabschnitt behandelt werden kann, um die Gesamtzahl der Bits zu verringern.

Mit einem Pulsquantisierungsabschnitt 50 und einem Pulsdequantisierungsabschnitt 80, die einen Teil der Frequenzdomänensignale eines Blocks codieren und decodieren können, kann die Anzahl der für den Quantisierungsprozess erforderlichen Bits verringert werden. Somit kann für eine Signalquelle mit einer größeren hervorstehenden Amplitude als die anderen Signale in einem Block mit einer kleineren Anzahl von Bits als im herkömmlichen Verfahren die gleiche Codierungsqualität wie bei dem herkömmlichen Verfahren erreicht werden. Folglich kann die Codierungseffizienz verbessert werden.

Obgleich die vorliegende Erfindung in Bezug auf eine beste Ausführungsform davon gezeigt und geschrieben wurde, ist für den Fachmann auf dem Gebiet selbstverständlich, dass darin die vorstehenden sowie verschiedene weitere Änderungen, Weglassungen und Hinzufügungen in Bezug auf deren Form und Einzelheit vorgenommen werden können, ohne von dem Erfindungsgedanken und von dem Umfang der vorliegenden Erfindung abzuweichen.


Anspruch[de]
  1. Codiersystem für Signale, welches aufweist:

    – einen Signalkonvertierungsabschnitt (2) zum Konvertieren eines Eingabesignals in Frequenzdomänen-Signale und zum Gruppieren einer Mehrzahl von Frequenzdomänen-Signalen in Blöcke;

    – einen Analysierabschnitt (3) zum Analysieren des Eingabesignals und der Frequenzdomänen-Signale und zum Erhalten eines erlaubten Fehlers;

    – eine Vielzahl von Quantisierungsabschnitten (5053) zum Quantisieren von Frequenzdomänen-Signalen jeden Blocks, um Amplitudeninformationen und Codes zu berechnen;

    – einen Auswahlabschnitt (4) zur Ausgabe von Quantisierungsabschnitt-Auswahlinformationen zum Auswählen eines der Vielzahl von Quantisierungsabschnitten (5053), der dem erlaubten Fehler entspricht; und

    – einen Multiplexabschnitt (6) zum Multiplexen der Amplitudeninformationen, der Codes und der Quantisierungsabschnitt-Auswahlinformationen, dadurch gekennzeichnet, dass

    – die Quantisierungsabschnitte (5053) zumindest einen ersten Quantisierungsabschnitt (50) umfassen, und zwar zum Codieren nur eines Teils von Frequenzdomänen-Signalen, welche große hervorstehende Amplitudenwerte im Verhältnis zu den anderen Frequenzdomänen-Signalen in jedem Block aufweisen, sowie zumindest einen zweiten Quantisierungsabschnitt (5153) zum Codieren des Rests der Frequenzdomänen-Signale in jedem Block, die nicht in dem ersten Codierabschnitt (50) codiert werden.
  2. Codiersystem nach Anspruch 1, bei dem die Ausgaben des ersten Quantisierungsabschnitts (50) einen Amplitudenindex und einen Frequenzindex für jeden Block umfassen.
  3. Codiersystem nach Anspruch 1, bei dem die Ausgaben des ersten Quantisierungsabschnitts (50) für jeden Block einen repräsentativen Amplitudenindex und eine Vielzahl von Frequenzindices umfassen.
  4. Codiersystem nach einem der Ansprüche 1 bis 3, bei dem der erste Quantisierungsabschnitt (50) die Frequenzdomänen-Signale jedes Blocks in Gruppen unterteilt und einen repräsentativen Frequenzindex der Gruppen auswählt.
  5. Codiersystem nach einem der Ansprüche 1 bis 4, bei dem der erste Quantisierungsabschnitt (50) ein Pulsquantisierungsabschnitt ist.
  6. Decodiersystem für Signale, welches aufweist:

    – einen Demultiplexierungsabschnitt (12) zum Demultiplexieren von Eingabesignalen in Amplitudeninformationen, Codes, und Quantisierungsabschnitt-Auswahlinformationen;

    – eine Vielzahl von Dequantisierungsabschnitten (8083) zum Dequantisieren der Codes mit den Amplitudeninformationen, die den Quantisierungsabschnitt-Auswahlinformationen entsprechen; und

    – einen Abschnitt für inverse Signalkonvertierung (13) zum Konvertieren eines Blocks von Ausgabesignalen der Dequantisierungsabschnitte (8083), dadurch gekennzeichnet, dass

    – die Dequantisierungsabschnitte (8083) zumindest einen ersten Dequantisierungsabschnitt (80) umfassen, und zwar zum Decodieren nur eines Teils von Frequenzdomänen-Signalen in jedem Block, welche große hervorstehende Amplitudenwerte im Verhältnis zu den anderen Frequenzdomänen-Signalen in jedem Block aufweisen, sowie zumindest einen zweiten Dequantisierungsabschnitt (8183) zum Decodieren des Rests der Frequenzdomänen-Signale in jedem Block, die nicht in dem ersten Dequantisierungsabschnitt (80) decodiert wurden.
  7. Decodiersystem nach Anspruch 6, bei dem Eingaben des ersten Dequantisierungsabschnitts (80) einen Amplitudenindex und einen Frequenzindex für jeden Block umfassen.
  8. Decodiersystem nach Anspruch 6, bei dem Eingaben des ersten Dequantisierungsabschnitts (80) für jeden Block einen repräsentativen Amplitudenindex und eine Vielzahl von Frequenzindices umfassen.
  9. Decodiersystem nach einem der Ansprüche 6 bis 8, bei dem der erste Dequantisierungsabschnitt (80) die Frequenzdomänen-Signale jeden Blocks in Gruppen aufteilt und einen repräsentativen Frequenzindex der Gruppen auswählt.
  10. Decodiersystem nach einem der Ansprüche 6 bis 9, bei dem der erste Dequantisierungsabschnitt (80) ein Pulsdecodierungsabschnitt ist.
  11. Decodiersystem nach Anspruch 6, dadurch gekennzeichnet, dass der zumindest eine erste Dequantisierungsabschnitt (80) und der zumindest eine zweite Dequantisierungsabschnitt (8183) basierend auf der Quantisierungsabschnitt-Auswahlinformation ausgewählt werden, die den Teil von Frequenzdomänen-Signalen angibt, die große hervorstehende Amplitudenwerte im Verhältnis zu den anderen Frequenzdomänen-Signalen in jedem Block vor dem Codieren hatten.
Es folgen 4 Blatt Zeichnungen






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com