PatentDe  


Dokumentenidentifikation DE602004004818T2 06.12.2007
EP-Veröffentlichungsnummer 0001683133
Titel AUDIOSIGNALCODIERUNG ODER -DECODIERUNG
Anmelder Koninklijke Philips Electronics N.V., Eindhoven, NL;
Coding Technologies AB, Stockholm, SE
Erfinder VILLEMOES, F., Lars, 90429 Nuernberg, DE;
EKSTRAND, Per, 90429 Nuernberg, DE;
PURNHAGEN, Heiko, 90429 Nuernberg, DE;
SCHUIJERS, G., Erik, NL-5656 AA Eindhoven, NL;
DE BONT, J., Fransiscus M., NL-5656 AA Eindhoven, NL
Vertreter Volmer, G., Dipl.-Ing., Pat.-Anw., 52066 Aachen
DE-Aktenzeichen 602004004818
Vertragsstaaten AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LI, LU, MC, NL, PL, PT, RO, SE, SI, SK, TR
Sprache des Dokument EN
EP-Anmeldetag 28.10.2004
EP-Aktenzeichen 047703335
WO-Anmeldetag 28.10.2004
PCT-Aktenzeichen PCT/IB2004/052226
WO-Veröffentlichungsnummer 2005043511
WO-Veröffentlichungsdatum 12.05.2005
EP-Offenlegungsdatum 26.07.2006
EP date of grant 14.02.2007
Veröffentlichungstag im Patentblatt 06.12.2007
IPC-Hauptklasse G10L 19/00(2006.01)A, F, I, 20060627, B, H, EP
IPC-Nebenklasse G10L 21/02(2006.01)A, L, I, 20060627, B, H, EP   

Beschreibung[de]

Die vorliegende Erfindung bezieht sich auf Codierung eines Audiosignals oder Decodierung eines codierten Audiosignals.

Erik Schuijers, Werner Oomen, Bert den Brinker und Jeroen Breebaart "Advances in Parametric Coding for High-Quality Audio", Preprint 5852, 114, AES Konvention, Amsterdam, Niederlande, 22. bis 25. März 2003 beschreibt ein parametrisches Codierungsschema, wobei eine effiziente parametrische Darstellung für das Stereobild verwendet wird. Zwei Eingangssignale werden zu einem einzigen Mono-Audiosignal vermischt. Wahrnehmbar relevante räumliche Stichwörter werden explizit modelliert, wie in 1 dargestellt. Das vermischte Signal wird unter Verwendung eines parametrischen Mono Codierers codiert. Die Stereo Parameter Interkanalintensitätsdifferenz (IID), die Interkanalzeitdifferenz (ITD) und die Interkanalkreuzkorrelation (ICC) werden quantisiert, codiert und gemultiplext zu einem Bitstrom, zusammen mit dem quantisierten und codierten Mono Audiosignal. An der Decoderseite wird der Bitstrom zu einem codierten Mono Signal und den Stereo Parametern gedemultiplext. Das codierte Mono Audiosignal wird decodiert zum Erhalten eines decodierten Mono Audiosignals m' (siehe 2). Aus dem Mono Zeitdomänensignal wird unter Verwendung eines Filters D ein dekorreliertes Signal berechnet, was eine wahrnehmbare Dekorrelation ergibt. Das Mono Zeitdomänensignal m' und das dekorrelierte Signal d werden zu einer Frequenzdomäne transformiert. Danach wird das Frequenzdomäne Stereosignal mit den IID-, ITD- und ICC-Parametern bearbeitet, und zwar durch Skalierung, Phasenmodifikation bzw. Mischung in einer Parameterverarbeitungseinheit zum Erhalten des decodierten Stereopaares 1' und r'. Die resultierenden Frequenzdomäne Darstellungen werden in die Zeitdomäne zurück transformiert.

Jin u. a. "A scalable Subband Coding Scheme for ATM Environments", "IE-EE SoutheastCon 2001, Seiten 271-275, beschreibt Teilbandfilterung mit nachfolgendem MDCT Transformation und Quantisierung entsprechend berechneten psychoakustischen Modellparametern.

Es ist nun u. a. eine Aufgabe der vorliegenden Erfindung, eine vorteilhafte Audio Codierung oder Decodierung zu schaffen, und zwar unter Verwendung räumlicher Parameter. Dazu schafft die vorliegende Erfindung ein Codierungsverfahren, einen Audiocodierer, eine Anordnung zur Übertragung oder Speicherung, ein Decodierungsverfahren, einen Audiodecoder, eine Wiedergabeanordnung und ein Computerprogrammprodukt, wie in den Hauptansprüchen definiert. Vorteilhafte Ausführungsformen sind in den Unteransprüchen definiert.

Nach einem ersten Aspekt der vorliegenden Erfindung wird ein Audiosignal codiert, wobei das Audiosignal einen ersten Audiokanal und einen zweiten Audiokanal aufweist, wobei die Codierung Teilbandfilterung des ersten Audiokanals sowie des zweiten Audiokanals in einer komplexen modulierten Filterbank umfasst zum Schaffen einer ersten Anzahl Teilbandsignale für den ersten Audiokanal und einer zweiten Anzahl Teilbandsignale für den zweiten Audiokanal, Abwärtsabtastung jedes der Teilbandsignale zum Schaffen einer ersten Anzahl abwärts abgetasteter Teilbandsignale und einer zweiten Anzahl abwärts abgetasteter Teilbandsignale, und einer weiteren Teilbandfilterung wenigstens eines der abwärts abgetasteten Teilbandsignale in einer weiteren Filterbank zum Schaffen einer Anzahl Subteilbandsignale, Herleitung räumlicher Parameter aus den Subteilbandsignalen und aus den abwärts abgetasteten Subteilbandsignalen, die nicht weiter teilbandgefiltert werden, und Herleitung eines Einkanal-Audiosignals mit hergeleiteten Teilbandsignalen, hergeleitet aus der ersten Anzahl abwärts abgetasteter Teilbandsignale und der zweiten Anzahl abwärts abgetasteter Teilbandsignale. Durch Durchführung einer weiteren Teilbandfilterung in einem Teilband wird die Frequenzauflösung des genannten Teilbandes gesteigert. Eine derartige größere Frequenzauflösung bietet den Vorteil, dass es möglich wird, eine höhere Audioqualität zu erzielen (die Bandbreite eines einzigen Teilbandsignal ist typischerweise viel höher als die kritischer Bänder in dem menschlichen Hörsystem) in einer effizienten Implementierung (weil nur einige Bänder transformiert zu werden brauchen). Der parametrische räumliche Codierer versucht die binärischen Stichwörter zu modellieren, die in einer nicht einheitlichen Frequenzskala erfahren werden, entsprechend der ERB-Skala ("Equivalent Rectangular Bands" ). Das Einkanal-Audiosignal kann unmittelbar von der ersten Anzahl abwärts abgetasteter Teilbandsignale und der zweiten Anzahl abwärts abgetasteter Teilbandsignale hergeleitet werden. Das Einkanal-Audiosignal wird aber auf vorteilhafte Art und Weise von Teilbandsignalen für diejenigen abwärts abgetasteten Teilbänder hergeleitet, die weiter teilbandgefiltert werden, wobei in diesem Fall die Teilbandsignale jedes Teilbandes zusammen gefügt werden um neue Teilbandsignale zu bilden und wobei das Einkanal-Audiosignal von diesen neuen Teilbandsignalen und den Teilbändern von der ersten und der zweiten Anzahl Teilbänder, die nicht weiter gefiltert werden.

Nach einem anderen Hauptaspekt der vorliegenden Erfindung wird Audiodecodierung eines codierten Audiosignals geschaffen, wobei das codierte Audiosignal ein codiertes Einkanal-Audiosignal und einen Satz räumlicher Parameter aufweist, wobei die Audiodecodierung die Decodierung des codierten Einkanal-Audiosignals umfasst zum Erhalten einer Anzahl abwärts abgetasteter Teilbandsignale, weiterhin die Teilbandfilterung wenigstens eines Signals der abwärts abgetasteten Teilbandsignale in einer weiteren Filterbank um eine Anzahl Teilbandsignale zu schaffen, und die Herleitung zweier Audiokanäle aus den räumlichen Parametern, den Teilbandsignalen und den abwärts abgetasteten Teilbandsignalen für diejenigen Teilbänder, die nicht weiter teilbandgefiltert werden. Dadurch, dass eine weitere Teilbandfilterung in einem Teilband durchgeführt wird, wird die Frequenzauflösung des genannten Teilbandes gesteigert und folglich kann eine Audiodecodierung einer höheren Qualität erzielt werden.

Einer der Hauptvorteile dieser Aspekte der vorliegenden Erfiung ist, dass eine parametrische räumliche Codierung auf einfache Art und Weise mit SBR-Techniken ("Spectral Band Replication") kombiniert werden kann. SBR ist an sich aus Martin Dietz, Lars Liljeryd, Kristofer Kjörling und Oliver Kunz "Spectral Band Replication, a novel approach in audio coding", Vorabdruck 5553, 112. AES Konvektion, München, Deutschland, 10. bis 13. Mai 2002 und aus Per Ekstrand "Bandwith extension of audio signals by spectral band replication", "Proc. 1 st IEEE Benelux Workshop on Model based Processing an Coding of Audio (MPCA-2002)", Seiten 53-58, Löwen, Belgien, 15. November 2002 bekannt. Weiterhin sei auf die MPEG-4 Norm ISO/IEC 14496-3:2001/FDAM1, JTC1/SC29/WG11, "Coding of Moving Picttuen an Audio, Bandwith Extension" was einen Audio-Codec unter Anwendung von SBR beschreibt.

SBR basiert auf dem Gedanken, dass es zwischen dem niedrigen und den hohen Frequenzen in einem Audiosignal eine große Korrelation gibt. Als solcher besteht der SBR-Prozess aus der Kopierung der unteren Teile des Spektrums zu den höheren Teilen, wonach die spektrale Umhüllende für die höheren Teile des Spektrums eingestellt wird, und zwar unter Verwendung von wenig Information, die codiert in dem Bitstrom vorhanden ist. Ein vereinfachtes Blockschaltbild eines derartigen SBR verbesserten Decoders ist in 3 dargestellt. Der Bitstrom wird gemultiplext und in Kerndaten decodiert (beispielsweise MPEG-2/4 AAC-Daten ("Advanced Audio Coding") und SBR-Daten. Unter Verwendung der Kerndaten wird das Signal mit der halben Abtastfrequenz des vollen Bandbreitensignals decodiert, Das Ausgangssignal des Kerndecoders wird mit Hilfe einer komplexen (Pseudo) Quadraturspiegelfilterbank (QMF) mit 32 Bändern analysiert. Diese 32 Bänder werden danach zu voller Bandbreite, d.h. zu 64 Bändern, erweitert, in denen der HF-Inhalt mit Hilfe von Kopierteilen der niedrigeren Bänder erzeugt wird. Die Umhüllende der Bänder, für die der HF-Inhalt erzeugt wird, wird entsprechend den SBR-Daten eingestellt. Zum Schluss wird mit Hilfe einer komplexen QMF Synthesebank mit 64 Bändern das PCM Ausgangssignal rekonstruiert.

Der SBR-Decoder, wie in 3 dargestellt, ist ein sog. Doppelratendecoder. Dies bedeutet, dass der Kerndecoder mit der halben Abtastfrequenz läuft und dass dadurch nur eine Analysen-QMF-Bank mit 32 Bändern verwendet wird. Einzelratendecoder, wobei der Kerndecoder mit der vollen Abtastfrequenz läuft und die Analysen-QMF-Bank aus 64 Bändern besteht, ist auch möglich. In der Praxis erfolgt die Rekonstruktion mit Hilfe einer (pseudo) komplexen QMF-Bank. Weil die komplexe QMF-Filterbank nicht kritisch abgetastet wird, brauchen keine zusätzlichen Maßnahmen getroffen zu werden um einen Alias-Effekt zu berücksichtigen. Es sei bemerkt, dass in dem SBR-Decoder, wie von Ekstrand beschrieben, die Analysen-QMF-Bank aus nur 32 Bändern besteht, während die Synthese-QMF-Bank aus 64 Bändern besteht, da der Kerndecoder mit der halben Abtastfrequenz läuft, dies im Vergleich zu dem ganzen Audiodecoder. In dem entsprechenden Codierer aber wird eine Analysen-QMF-Bank mit 64 Bändern verwendet um den ganzen Frequenzbereich zu decken.

Obschon die vorliegende Erfindung insbesondere vorteilhaft ist für Stereo Audiocodierung, ist die vorliegende Erfindung auch vorteilhaft bei der Codierung von Signalen mit mehr als zwei Audiokanälen.

Ausführungsbeispiele der vorliegenden Erfindung sind in der Zeichnung dargestellt und werden im Folgenden näher beschrieben. Es zeigen:

1 ein Blockschaltbild einer Einheit zur Stereo Parameterextraktion, wie in einem parametrischen Stereo Codierer ("PS") verwendet,

2 ein Blockschaltbild einer Einheit zur Rekonstruktion eines Stereosignals, wie in einem PS-Decoder verwendet,

3 ein Blockschaltbild eines SBR-Decoders ("Spectral Band Replication")

4 ein Blockschaltbild eines kombinierten PS- und SBR-verbesserten Codierers nach einer Ausführungsform der vorliegenden Erfindung,

5 ein Blockschaltbild eines kombinierten PS- und SBR-verbesserten Codierers nach einer Ausführungsform der vorliegenden Erfindung,

6 eine abwärts abgetastete komplexe QMMF Analysenbank (links) und Synthesenbank (rechts) mit M Bändern,

7 eine Größenreaktion in dB eines Prototypenfilters,

8 eine Größenreaktion in dB der ersten vier von 64 nicht abwärts abgetasteten komplexen modulierten Analysenfiltern,

9 ein Blockschaltbild einer Filterbank mit Q Bändern mit unbedeuteter Synthese,

10 eine kombinierte Größenreaktion in dB eines ersten nicht abwärts abgetasteten modulierten QMF-Filters und einer komplexen modulierten Filterbank mit 8 Bändern,

11 eine stilisierte Größenreaktion einer gleichmäßig gestapelten Filterbank mit vier Bändern (oben) und einer unregelmäßig gestapelten Filterbank (unten)( nach einer Ausführungsform der vorliegenden Erfindung,

12 eine nicht einheitliche hybride Analysenfilterbank mit 77 Bändern auf Basis einer komplexen Analyse QMF mit 64 Bändern nach einer Ausführungsform der vorliegenden Erfindung,

13 eine nicht einheitliche hybride Analysenfilterbank auf Basis einer komplexen Analyse QMF mit 64 Bändern zur Verwendung in einem Audiodecoder, und

14 ein Blockschaltbild einer effizienten Implementierung der komplexen modulierten Analysenfilterbank.

Die Zeichnung zeigt nur diejenigen Elemente, die zum Verständnis der vorliegenden Erfindung erforderlich sind.

Das Kombinieren von SBR mit PS ergibt möglicherweise einen extrem starken Codec. SBR sowie PS sind Nachbearbeitungsalgorithmen in einem Decoder, der aus einer ziemlich ähnlichen Struktur besteht, d.h. einer bestimmten Form von Zeit-zu-Frequenzumwandlung, Verarbeitung und zum Schluss einer Frequenz-zu-Zeitumwandlung. Wenn die beiden Algorithmen kombiniert werden ist es erforderlich, dass die beiden Algorithmen gleichzeitig in beispielsweise einer DSP Applikation laufen können. Es ist vorteilhaft, möglichst viel von den berechneten Zwischenergebnissen des einen Codecs für den anderen wieder zu verwenden. Im Falle einer Kombination von PS und SBR führt dies zu einer Neuverwendung der komplexen (Pseudo) QMF Teilbandsignale für PS-Verarbeitung. In einem kombinierten Codierer (siehe 4)wird das Stereo-Eingangssignal mit Hilfe zweier Analysenfilterbanken mit 64 Bändern analysiert. Unter Verwendung der komplexen Teilbanddomänendarstellung schätzt eine PS Recheneinheit die Stereo-Parameter und schafft eine Mono (Teilband) Abwärtsmischung. Diese Mono Abwärtsmischung wird danach einer SBR Parameterschätzungseinheit zugeführt. Zum Schluss wird die Mono Abwärtsmischung mit Hilfe einer Synthesefilterbank mit 32 Bändern in die Zeitdomäne zurückverwandelt, so dass diese durch den Kerndecoder codiert werden kann (der Kerndecoder braucht nur die halbe Bandbreite).

In dem kombinierten Decoder, wie in 5 dargestellt, werden, ungeachtet ob ein Doppelraten- oder ein Einzelratensystem angewandt wird, die ganzen Bandbreite-(64 Bänder)-Teilbanddomänensignale nach der Umhüllendeneinstellung zu einem Stereosatz mit Teilbanddomänensignalen entsprechend den Stereoparametern umgewandelt werden. Diese zwei Sätze mit Teilbandsignalen werden zum Schluss in die Zeitdomäne umgewandelt, und zwar mit Hilfe der Synthese QMF Bank mit 64 Bändern umgewandelt. Wenn man nur PS mit SBR kombinieren würde, ist die Bandbreite der niedrigeren Frequenzbänder des QMF-Filters größer als für eine Stereodarstellung hoher Qualität erforderlich. Damit man imstande ist, eine Darstellung des Stereobildes hoher Qualität zu bieten, wird nach vorteilhaften Ausführungsformen der vorliegenden Erfindung eine weitere Unterteilung der niedrigeren Teilbandsignale durchgeführt.

Zum besseren Verständnis von Aspekten der vorliegenden Erfindung wird zunächst die Theorie hinter den komplexen QMF-Teilbandfiltern erläutert.

QMF-Teilbandfilter

Das QMF-Anlysenteilbandfilter kann wie folgt beschrieben werden. Wenn ein reell bewertetes lineares Phasenprototypfilter p(v) gegeben ist, kann eine M-Band komplexe modulierte Analysenfilterbank durch die Analysenfilter definiert werden:

Phasenparameter &THgr; ist für die nachfolgende Analyse nicht wichtig, Für k = 0,1, ..., M – 1. Der aber eine typische Wahl ist (N + M)/2, wobei N die Prototypenfilterordnung ist. Wenn ein reell bewertetes diskretes Zeitsignal x(v) gegeben ist, werden die Teilbandsignale vk(n) durch Filterung (Konvolution) von x(v) mit hk(v) und durch nachfolgende Abwärtsabtastung des Ergebnisses um einen Faktor M erhalten (siehe das linke Seitenband in 6).

Ein Synthesevorgang besteht zunächst aus der Aufwärtsabtastung der QMF-Teilbandsignale um einen Faktor M, wonach eine Filterung mit komplexen modulierten Filtern vom Typ (1) und Addierung der Ergebnisse folgt, und wobei zum Schluss zweimal den reellen Teil genommen wird (siehe den rechten Teil in 6). Danach kann eine fast einwandfreie Rekonstruktion der reell bewerteten Signal durch einen geeigneten Entwurf eines reell bewerteten linearen Phasenprototypfilters p(v) erhalten werden. Die Größenreaktion des Prototypfilters, wie dieses in dem SBR-System der MPEG-4 Norm (oben genannt) im Falle von 64 Bändern verwendet wird, ist in 7 dargestellt. Die Größenreaktion der 64 komplexen modulierten Analysenfilter wird durch Verschiebung der Größenreaktion des Prototypenfilters p(v) by

rhalten. Ein teil dieser Reaktionen ist in 8 dargestellt. Es sei bemerkt, dass nur die positiven Frequenzen gefiltert werden, ausgenommen für k = 0 und k = M – 1. Dadurch sind die Teilbandsignale vor der Abwärtsabtastung nahezu analytisch, was Amplituden- und Phasenmodifikationen reell bewerteter Sinuskurven ermöglicht. Phasenmodifikationen sind auch für das erste und das letzte Band möglich, solange die Sinuskurven, die in diesen Bändern liegen, eine Frequenz haben, die über &pgr;/2M oder unterhalb &pgr; – &pgr;/2M liegt. Für Frequenzen außerhalb dieses Gebietes verschlechtert die Leistung der Phasenmodifikation schnell, und zwar wegen Interferenz der negativen Frequenzen.

Ausgehend von QMF-Analysenfiltern, wie oben beschrieben, wird in Ausführungsformen der vorliegenden Erfindung eine feinere Frequenzauflösung dadurch erhalten, dass jedes abwärts abgetastete Teilbandsignal vk(n) zu Qk weiter gefiltert wird. Nachstehend werden die Eigenschaften der weiteren Teilbandfilterung hergeleitet.

Signalmodifikation in einer komplexen QMF-Teilbanddomäne

Nachstehend wird vorausgesetzt, dass

die diskrete Zeit Fourier-Transformation eines diskreten Zeitsignals z(n) ist. Es wird die nahezu einwandfreie Rekonstruktionseigenschaft, wie oben genannt, und auch der Entwurf, wobei P(&ohgr;), die Fourier-Transformation p(v), im Wesentlichen aus dem Frequenzintervall [–&pgr;/M, n/M] verschwindet, was für das Prototypfilter p(v) der Fall ist, wie oben dargestellt, wobei nun der nächste Schritt hier ist, ein System zu betrachten, wobei die Teilbandsignale vk(n) vor der Synthese modifiziert werden. Nun wird vorausgesetzt, dass jedes Teilband k durch Filterung mit einem Filter Bk(&ohgr;) modifiziert wird. Mit der bestehenden Definition Bk(&ohgr;) = B-1-k(–&ohgr;)* for k < 0(2)

Wobei der Stern eine komplexe Konjugation bedeutet, kann dargelegt werden (wobei eine gesamte Verzögerung vernachlässigt wird, unter der Voraussetzung einer reell bewerteten Eingangssignals und eines Einzelratensystems), dass das resultierende System mit Filterbanksynthese einer Filterung mit dem nachfolgenden Filter entspricht:

Entsprechend der Hypothese in Bezug auf die Eigenschaften von P(&ohgr;), wobei Bk(&ohgr;) = 1 für alle k in (3) zu B(&ohgr;) = 1 führt, eingefügt wird, und eine quadratische Summenidentität für die verschobenen Prototypenreaktionen folgt. Durch die Wahl von reell bewerteten Konstanten Bk(&ohgr;) = bk≥ 0 ist das System als Entzerrer wirksam, der die Verstärkungswerte bk bei den Frequenzen &pgr;(k + 1/2)/M interpoliert. Das interessante Merkmal ist, dass das Gesamtsystem zeitinvariant ist, d.h. ohne Aliasing-Effekt, trotz der Anwendung von Abwärts- und Aufwärtsabtastung. Dies gilt selbstverständlich nur bis zum Betrag der Abweichung von den genannten Prototypenfilterhypothesen.

Um ein Mono Audiosignal herzuleiten, soll eine zusätzliche Teilfilterung der komplexen Teilbandsignale nicht nur diese Eigenschaften aufbewahren, sondern auch diese Eigenschaften auf Manipulation der gefilterten Teilbandsignale erweitern. Teilfilterung, welche diese Eigenschaften beibehält, kann durchgeführt werden, und zwar unter Anwendung von Modifikation so genannter M. Bandfilter, wie an sich aus P.P. Vaidyanathan "Multirate systems and filter banks", Prentice Hall Signal Processing Series, 1993, Abschnitte 4.6.1–4.6.2.

Modulierte Filterbanken mit unbedeutender Synthese

Ein diskretes Zeitsignal v(n) kann durch eine Bank mit Filtern mit Impulsantworten gq(n), q = 0,1, .., Q – 1, in Q verschiedene Signale aufgeteilt werden. Dies ist in 9 dargestellt.

Es wird vorausgesetzt, dass die entsprechenden Analysenausgänge yq(n) sind und es wird nun die unbedeutende Synthese betrachtet:

Eine Einwandfreie Rekonstruktion y(n) = v(n), wird danach durch eine derartige Wahl der Filter erhalten, dass

Wobei &dgr;(n) = 1 ist, wenn n = 0 ist, und &dgr;(n) = 0 ist, wenn n ≠ 0 ist. Für Kausalfilter sollte die rechte Seite von (5) durch &dgr;(n – d) ersetzt werden, wobei d eine positive Verzögerung ist, aber auf diese einfache Modifikation wird der Deutlichkeit der Erläuterung halber verzichtet.

Die Filter gq(n) können als komplexe Mudulationen eines Prototypenfilters g(n) gewählt werden, durch

In dieser bevorzugten Ausführungsform der vorliegenden Erfindung werden die Filter unregelmäßig gestapelt (der Faktor q + 1/2). Ein Vorteil dieser bevorzugten Ausführungsform wird nachher noch näher erläutert. Eine einwandfreie Rekonstruktion (5) wird erhalten, wenn und nur wenn g(Qn) = &dgr;(n)/Q.(3)

Eine Variation darauf ist die reell bewertete Kosinusmodulation wie

wobei ein reell bewertetes Prototypenfilter g(m) Folgendes erfüllt: g(2Qn) = &dgr;(n)/Q.(5)

Subfilterung der komplex-exponentiellen modulierten Filterbank

Ausgehend von den QMF-Analysenfiltern, wie oben beschrieben, wird eine feinere Frequenzauflösung dadurch erhalten, dass jedes abwärts abgetastete Teilbandsignal vk(n) zu Qk Unterteilbändern weiter gefiltert wird, und zwar durch Anwendung einer der modulierten oben stehenden Strukturen (6) oder (8). Die resultierenden Ausgangssignale ykq(n) sollen bemerkt werden und es wird vorausgesetzt, dass gkq(n) die Filterbank beschreibt, die in dem Teilband k angewandt wurde. Wenn Qk = 1 ist gibt es keine Filterung und gk0(n) = &dgr;(n). Ein typisches Applikationsbeispiel ist der Fall, wobei M = 64 , Q0 = 8 , Qk = 4 für k = 1,2, and Qk = 1 für k > 2.

Der kombinierte Effekt der zwei Filterbanken aus x(v) zu ykq(n) kann als Filterung mit den Filtern Fkq(&ohgr;) mit einer nachfolgenden Abwärtsabtastung um einen Faktor M beschrieben werden, wobei Fkq(&ohgr;) = Hk(&ohgr;)Gkq(M&ohgr;).(6)

Wenn die Prototypenfilterreaktion P(&ohgr;) wesentlich Null ist außerhalb des Intervalls [–&pgr;/M, &pgr;/M], was der Fall ist für die SBR Analysenfilter (siehe 7), dann hat das Filter Fkq(&ohgr;) eine einzelne nominale Mittenfrequenz, definiert in dem komplexen modulierten Fall durch &ohgr;k,q = 2&pgr;(q + Qks + 1/2)/(MQk),(11) wobei s eine ganze Zahl ist, derart gewählt, dass Qk (k – 1/2) ≤ 2(q + Qks) + 1 ≤ Qk (k + 3/2) Wie beispielsweise in 10 dargestellt, wenn k = 0 ist und Q0 = 8 ist, sind die Werte von &ohgr;0,0, &ohgr;0,1, ..., &ohgr;0,7

Signalmodifikation mit einer nicht einheitlichen Frequenzauflösung

Die Einfügung von Unterteilbandfiltern, wie oben beschrieben, führt keine weitere Abwärtsabtastung ein, so dass die Aliasing-freie Leistung der Signalmodifikation, wie oben nur im Falle der komplexen QMF dargestellt, aufbewahrt wird. Es wird nun der allgemeine kombinierte Vorgang der M-Teilbandanalyse, die weitere Teilbandfilterung durch Verwendung von Qk, von Unterteilbändern innerhalb des Teilbandes k, Filterung jedes Unterteilbandsignals ykq(n) durch ein Filter Ak,g(&ohgr;), Synthese innerhalb jedes Teilbandes k durch Summierung und zum Schluss Synthese durch die M-Band Synthesebank. Die gesamte Übertragungsfunktion eines derartigen Systems wird gegeben durch (3) mit für k ≥ 0,

Für &ohgr; > &pgr;/(2M), ergibt dies

so dass die Durchführungsreaktion des Unterteilbandes (k, q) wie folgt ist: Gkq(M&ohgr;)|P(&ohgr; – &pgr;(k + 1/2)/M)|2.

Für |&ohgr;| ≤ &pgr;/(2M) soll Acht gegeben werden, und zwar wegen (2). In diesem Frequenzbereich gilt, dass B(&ohgr;) = B0(M&ohgr;)|P(&ohgr; – &pgr;/(2M))|2 + B0(–M&ohgr;)*|P(&ohgr; + &pgr;/(2M))|2(14) und wenn echte Unterteilband Prototypenfilterkoeffizienten vorausgesetzt werden, gilt dass

so dass, wenn die modifizierenden Filter derart gewählt werden, dass
dann B0(–M&ohgr;)* = B0(M&ohgr;) und die quadratische Summenidentität, erwähnt im Zusammenhang mit (3) führt zu B0(–M&ohgr;)* = B0(M&ohgr;)(17) für |&ohgr;| ≤ &pgr;/(2M), entsprechend einer Durchführungsreaktion G0q(M&ohgr;) für das Unterteilband (0, q).

Die Gleichungen (15) bis (17) geben den Wunsch zum Unterscheiden zwischen positiven und negativen Frequenzen an. Dies ist der Grund, weshalb unregelmäßig gestapelte (komplexe) Filter zur Teilfilterung der QMF-Unterteilbandsignale statt der regelmäßig gestapelter (komplexer) Filter verwendet erden (siehe 11). Für gleichmäßig gestapelte Filter ist es nicht möglich, Phasenmodifikationen der Sinuskurven in dem zentralen Filter anzuwenden, d.h. in dem Filter mit einer Mittenfrequenz gleich Null, da es dort nicht zwischen positiven und negativen Frequenzen unterscheiden kann. Es wird nun ein Prototypenfilter mit einer Reaktion G(&ohgr;) vorausgesetzt, dessen Band auf [–2&pgr;/Q,2&pgr;/Q] begrenzt ist, wobei Q die Anzahl Bänder ist, für den gleichmäßig gestapelten Fall, ist die untere Grenze, auf die Phasenmodifikationen nahezu angewandt werden können, 2&pgr;/Q, während für den unregelmäßig gestapelten Fall die untere Grenze, auf die Phasenmodifikationen nahezu angewandt werden können, &pgr;/Q ist.

Wie eingangs erwähnt, sind für PS Synthese wichtige Spezialfälle Entzerrung und Phasenmodifikation. Für Entzerrung Ak,q(&ohgr;) = ak,q ≥ 0 und die Bedingung (16) reduziert auf

Der Phasenmodifikationsfall entspricht Ak,q(&ohgr;) = exp(i&agr;k,q) wobei in diesem Fall die Bedingung (16) erfüllt wird, wenn

Stereo-Parameterschätzung

Die nicht einheitliche komplexe Filterbank, d.h. die QMF-Bank, der die weitere Teilbandfilterung, wie oben beschrieben, kann angewandt werden um die Stereoparameter IID ("Inter-channel Intensity Differences"), IPD ("Inter-channel Phase Differences und ICC ("Inter-channel Cross Correlation", wie nachstehend dargestellt, zu schätzen. Es sei bemerkt, dass in dieser speziellen Ausführungsform IPD als praktisch gleichwertigen Ersatz für die ITD verwendet wird, die in der Veröffentlichung von Schuijers u. a. verwendet wird. In dem kombinierten PS Codierer (siehe 4) werden die ersten drei komplexen QMF Kanäle teilgefiltert, so dass insgesamt 77 komplex bewertete Signale erhalten werden (siehe 12).

Von diesem Punkt aus werden die 77 komplex bewerteten, zeitlich ausgerichteten linken und rechten Unterteilbandsignale wie folgt bezeichnet: lkq(n) bzw. rkq(n) , und zwar entsprechend der Indexierung von ykq(n) .

Zum Schätzen der Stereoparameter an einer bestimmten Teilbandabtaststelle n' werden die linke, rechte und nicht normalisierte Kreuzkanalanregung wie folgt berechnet:

für jedes Stereo-Bin b, ist h(n) das Teilbanddomänenfenster mit der Länge L, &egr; ein sehr kleiner Wert, der Teilung durch Null vermeidet (beispielsweise &egr; = 1e – 10 ) und lkq(n) und rkq(n) das linke und rechte Unterteilband-Domänensignal. Im Falle von 20 Stereo-Bins geht die Summierung über k von ki bis einschließlich kh und q von q1 bis einschließlich qh wie in der Tabelle dargestellt. Es sei bemerkt, dass die "negativen" Frequenzen (beispielsweise k = 0 mit q = 4...7) nicht in die Parameterschätzung von (20) eingeschlossen sind.

Tabelle 1: Start- und Stop-Indizes der Summierung über k und q

Die Summierungen zum Berechnen von el(b), er(b) und eR(b) werden derart ausgerichtet, dass der Mittelpunkt dieser Signale in der Summierung mit der Parameterstelle zusammenfällt, daher die Verschiebung um

Wie aus der Tabelle 1 hervorgeht, werden nur Unterteilbandsignale und Teilbandsignale mit einer positiven Mittenfrequenz zum Schätzen von Stereoparametern verwendet.

Die IID, bezeichnet als I(b), die ICC, bezeichnet als C(b) und die IPD, bezeichnet als P(b) für jedes Stereo-Bin b wird berechnet als:

Der Winkel in der Gleichung P(b) = ⦟eR(b) wird unter Verwendung der vier Quadranten Arcustangensfunktion, die Werte zwischen –&pgr; und &pgr; gibt, berechnet. Je nach Zielbitrate und Applikation werden diese Parameter oder ein Subsatz dieser Parameter quantisiert und in den PS Teil des Bitstroms codiert.

Stereosignalsynthese

Um die Rechenkosten (in Termen von RAM-Benutzung) in dem Decoder möglichst niedrig zu halten, wird eine ähnliche Analysenstruktur verwendet. Das erste Band aber ist nur teilweise komplex (siehe 13). Dies wird durch Summierung der Mittenbandpaare G02(&ohgr;) und G05(&ohgr;) und G03(&ohgr;) und G04(&ohgr;) erhalten. Weiterhin sind das zweite und das dritte Band reell bewertete Doppelbandfilterbanken, die durch Summierung des Ausgangssignals von G0k(&ohgr;) und des Ausgangssignals Gk3(&ohgr;) und durch Summierung von Gk1(&ohgr;) und Gk2(&ohgr;) erhalten werden (siehe auch die Beschreibung in dem Abschnitt über modulierte Filterbanken). Unter Anwendung dieser Vereinfachung der Decoderfilterbankstruktur wird dennoch das unterscheidende Merkmal zwischen positiven und negativen Frequenzen beibehalten durch Unterteilung des ersten Teilbandfilters. Die Decoderanalysenfilterbank ist in 13 dargestellt. Es sei bemerkt, dass die Indexierung der ersten QMF gefilterten (Unter)Teilbandsignale nach der Frequenz sortiert ist.

Die Stereo-(Unter)Teilbandsignale eines einzigen Frames sind wie folgt konstruiert: lk(n) = &Lgr;11sk(n) + &Lgr;21dk(n) rk(n) = &Lgr;12sk(n) + &Lgr;22dk(n)(22)

wobei Sekundärknoten(n) die Mono (Unter)Teilbandsignale sind und dk(n) die Mono dekorrelierten (Unter)Teilbandsignale sind, die von den Mono (Unter)Teilbandsignalen hergeleitet werden, um Synthetisierung der ICC Parameter zu berücksichtigen, wobei k = 0, ... ,K – 1 der Teilbandindex ist (K ist die gesamte Anzahl Teilbänder, d.h. K = 71), QMF Teilbandabtastindex n = 0, ... N – 1 wobei N die Anzahl Teilbandabtastwerte eines Frames ist, wobei &Lgr;11, &Lgr;12, &Lgr;21, A22 die Skalierungsfaktormanipulationsmatrizes sind und wobei Prt die Phasenrotationsmanipulationsmatrix ist. Die Manipulationsmatrizes sind als eine Funktion der Zeit und der Frequenz definiert und können einfach aus den Manipulationsvektoren hergeleitet werden, wie in der MPEG-4 Norm ISO/IEC 14496-3:2001/FPDAM2, JTC1/SC29/WG11, "Coding of Moving Pictures and Audio", Erweiterung 2 beschrieben worden ist.

sk(n) wird entsprechend 12 definiert, resultierend in 13: s0(n) = y06(n) s1(n) = y07(n) s2(n) = y00(n) s3(n) = y01(n) s4(n) = y02(n) + y05(n) s5(n) = y03(n) + y04(n) s6(n) = y01(n) + y13(n) s7(n) = y11(n) + y12(n) s8(n) = y20(n) + y23(n) s9(n) = y21(n) + y22(n) sk(n) = yk-70(n) k = 10...70

Synthese der Stereo Parameter erfolgt entsprechend der Indexierung der Tabelle 1.

Tabelle 1: Parameterindexierungstabelle

Die Synthesengleichungen sehen auf diese Weise wie folgt aus: lk (n) = &Lgr;11(i(k), n)sk(n) +&Lgr;21(i(k), n)dk(n) rk (n) = &Lgr;12(i(k), n)sk(n) + &Lgr;22(i(k), n)dk(n)(25)

Es sei bemerkt, dass das Vorzeichen von Prt sich in den oben stehenden Gleichungen ändert, wenn ein Asterisk in der Tabelle gefunden wird. Dies ist entsprechend der Gleichung (19), d.h. die inverse Phasendrehung soll für die negativen Frequenzen angewandt werden.

Effiziente Implementierung modulierter Filterbanken mit trivialer Synthese

Wenn eine modulierte Filterbank mit einem Prototypenfilter der Länge L vorausgesetzt wird, würde eine direkte Formimplementierung QL Vorgänge je Eingangsabtastwert erfordern, aber die Tatsache, dass die Modulation in (6) antiperiodisch zu der Periode Q ist, kann verwendet werden um die Filterung in eine Polyphasenfensterung von L Vorgängen aufzuteilen, wonach eine Transformation der Größe Q für jeden Eingangsabtastwert folgt. Es sei bemerkt, dass eine Polyphasendarstellung an sich aus P.P. Vaidyanathan "Multirate systems and filter banks", "Prentice Hall Signal Processing Series", 1993, Abschnitt 4.3) bekannt ist. Untenstehendes schafft eine vorteilhafte Applikation einer derartigen Polyphasendarstellung nach einer bevorzugten Ausführungsform der vorliegenden Erfindung.

Die Transformation ist eine DFT mit nachfolgender Phasendrehung, die von der Größenordnung Qlog2Q ist, wenn Q die zweite Potenz ist. Eine derart große Einsparung wird in typischen Fällen erreicht, wenn L viel größer ist als log2Q. In dem reell modulierten Fall (8) kann Antiperiodizität der Periode 2Q kombiniert mit geraden/ungeraden Symmetrien um n = 0 und n = Q wieder zur Polyphasenfensterung verwendet werden und der Transformationskern ist eine DCT vom Typ III. Eine detaillierte Beschreibung für den Fall einer komplexen Modulation wird unten gegeben.

Eine effektive Implementierung der Unterteilfilterung, unter Anwendung von FFT Kernverarbeitung kann unter Anwendung von Polyphasendekomposition des Prototypenfilters mit nachfolgender Modulation verwirklicht werden. Es wird nun ein Prototypenfilter g(n) der Größenordnung N vorausgesetzt, wobei N = mQ ist und wobei m ein positive ganze Zahl ist. Diese Bedingung ist nicht begrenzend, da ein Prototypenfilter einer beliebigen Größenordnung Null-gepolstert sein kann um die Beschränkung zu erfüllen. Die Z-Transformation des Prototypenfilters, entworfen zur Verwendung in einem komplexen modulierten System (6) ist:

Dies kann in Polyphasennotierung ausgedrückt werden wie:

wobei

Alle Filter der Filterbank sind frequenzmodulierte Versionen des Prototypenfilters. Die Z-Transformation des Filters gq(n) wird gegeben durch:

wobei

Der Ausdruck für das Ausgangssignal eines einzigen Filters ist:

Durch Identifikation der Elemente der letzten Summe ist ersichtlich, dass die Polyphasenelemente verzögerte Versionen des Eingangssignals verarbeiten, die danach mit einer exponentiellen Größe multipliziert werden. Zum Schluss werden alle Ausgangssignale Yq(z), q = 0...Q – 1 dadurch gefunden, dass eine invertierte FFT (ohne Skalierungsfaktor) angewandt wird. 14 zeigt das Layout für die Analysenfilterbank. Da die Polyphasenfilter in (29) nicht-kausal sind, soll ein wesentlicher Betrag an Verzögerung zu allen Polyphasenelementen hinzugefügt werden.

Es sei bemerkt, dass die oben genannten Ausführungsformen die vorliegende Erfindung mehr illustrieren als begrenzen und dass der Fachmann imstande sein wird, im Rahmen der beiliegenden Patentansprüche viele alternative Ausführungsformen zu entwerfen. In den Ansprüchen sollen eingeklammerte Bezugszeichen nicht als den Anspruch begrenzend betrachtet werden. Das Wort "umfassen" schließt das Vorhandensein anderer Elemente oder Schritte als diejenigen, die in einem Anspruch genannt sind, nicht aus. Die vorliegende Erfindung kann mit Hilfe von Hardware mit vielen einzelnen Elementen und mit Hilfe eines auf geeignete Art und Weise programmierten Computers implementiert werden In einem Anordnungsanspruch, worin viele Mittel nummeriert sind, können viele dieser Mittel durch ein und dasselbe Hardware-Item verkörpert werden. Die bloße Tatsache, dass bestimmte Maßnahmen in untereinander verschiedenen Unteransprüchen genannt sind, gibt nicht an, dass eine Kombination dieser Maßnahmen nicht auf vorteilhafte Weise angewandt werden könnte.

Text in der Zeichnung Fig. 1

  • Nicht einheitliche Filterung
  • Parameterextraktion

Fig. 2

  • Zeit-Frequenz-Transformation
  • Parameterverarbeitung
  • Frequenz-Zeit-Transformation

Fig. 3

  • Bitstrom
  • Bitstromdemultiplexer
  • Kerndecoder
  • 32 Band Analysen-QMF
  • Umhüllende-Einstellelement
  • 64 Band Synthese-QMF
  • PCM Ausgang

Fig. 4

  • PCM links
  • 64 Band Analysen-QMF
  • PS Parameterschätzung + Mono-Abwärtsmischung
  • SBR Parameterschätzung
  • PS-Bitstrom
  • 32 Band Synthese QMF
  • Kerncodierer
  • Kernbitstrom

Fig. 5

  • Bitstrom
  • Bitstromdemultiplexer
  • Kerndecoder
  • 32 Band Analysen-QMF
  • Umhüllende-Einstellelement
  • Parametrische Stereo Parameter
  • Parametrische Stereo Synthese
  • 64 Band Synthese-QMF
  • Linkskanal PCM
  • Rechtskanal PCM


Anspruch[de]
Verfahren zum Codieren eines Audiosignals, wobei das Audiosignal einen ersten Audiokanal und einen zweiten Audiokanal aufweist, wobei das Verfahren die nachfolgenden Verfahrensschritte umfasst:

– Teilbandfilterung des ersten Audiokanals sowie des zweiten Audiokanals in einer komplex modulierten Filterbank zum Schaffen einer ersten Anzahl Teilbandsignale für den ersten Audiokanal und einer zweiten Anzahl Teilbandsignale für den zweiten Audiokanal,

– Unterabtastung jedes der Teilbandsignale zum Schaffen einer ersten Anzahl unterabgetasteter Teilbandsignale und einer zweiten Anzahl unterabgetasteter Teilbandsignale,

– weitere Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale in einer weiteren Filterbank um eine Anzahl Unterteilbandsignale zu schaffen,

– Herleitung räumlicher Parameter aus den Unterteilbandsignalen und aus denjenigen unterabgetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden, und

– Herleitung eines Einkanalaudiosignals mit hergeleiteten Teilbandsignalen, hergeleitet aus der ersten Anzahl unterabgetasteter Teilbandsignale und der zweiten Anzahl unterabgetasteter Teilbandsignale.
Verfahren nach Anspruch 1, wobei für jedes Teilband, das weiter teilbandgefiltert wird, die Unterteilbandsignale nach Skalierung und/oder Phasendrehung zusammengefügt werden, und zwar zum Bilden eines neuen Teilbandsignals, und wobei das Einkanalaudiosignal aus diesen neuen Teilbandsignalen und den unterabgetasteten Teilbandsignalen, die nicht weiter gefiltert werden, hergeleitet werden. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterung an wenigstens dem Teilbandsignal mit der niedrigsten Frequenz der ersten Anzahl unterabgetasteter Teilbandsignale und an dem Teilbandsignal mit der niedrigsten Frequenz der zweiten Anzahl unterabgetasteter Teilbandsignale durchgeführt wird. Verfahren nach Anspruch 3, wobei die weitere Teilbandfilterung weiterhin an wenigstens dem Teilbandsignal mit der zweitniedrigsten Frequenz der ersten Anzahl unterabgetasteter Teilbandsignale und an dem Teilbandsignal mit der zweitniedrigsten Frequenz der zweiten Anzahl unterabgetasteter Teilbandsignale durchgeführt wird. Verfahren nach Anspruch 4, wobei die Anzahl Unterteilbänder in den Teilbandsignalen mit der niedrigsten Frequenz gröber ist als die Anzahl Unterteilbänder in den Teilbandsignalen mit der zweitniedrigsten Frequenz. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterbank wenigstens teilweise eine komplex modulierte Filterbank ist. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterbank wenigstens teilweise eine reell bewertete kosinusmodulierte Filterbank ist. Verfahren nach Anspruch 1, wobei die weitere Teilbandfilterbank eine unüblich gestapelte Filterbank ist. Verfahren nach Anspruch 1, wobei die Unterteilbandsignale nicht weiter unterabgetastet werden. Verfahren nach Anspruch 1, wobei das Einkanal-Audiosignal in der Bandbreite begrenzt ist und weiter codiert ist und wobei Spektralband-Replikationsparameter von der ersten Anzahl unterabgetasteter Teilbandsignale und/oder der zweiten Anzahl unterabgetasteter Teilbandsignale hergeleitet werden. Audiocodierer zum Codieren eines Audiosignals, wobei das Audiosignal einen ersten Audiokanal und einen zweiten Audiokanal aufweist, wobei der Codierer die nachfolgenden Elemente aufweist:

– eine erste komplex modulierte Filterbank zur Teilbandfilterung des ersten Audiokanals zum Schaffen einer ersten Anzahl Teilbandsignale für den ersten Audiokanal,

– eine zweite komplex modulierte Filterbank zur Teilbandfilterung des zweiten Audiokanals zum Schaffen einer zweiten Anzahl Teilbandsignale für den zweiten Audiokanal,

– Mittel zum Unterabtasten jedes der Teilbandsignale zum Schaffen einer ersten Anzahl unterabgetasteter Teilbandsignale und einer zweiten Anzahl unterabgetasteter Teilbandsignale,

– eine weitere Filterbank zur weiteren Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale, zum Schaffen einer Anzahl Unterteilbandsignale,

– Mittel zum Herleiten räumlicher Parameter von den Unterteilbandsignalen und von denjenigen unterabgetasteten Teilbandsignalen, die nicht weiter unterabgetastet werden, und

– Mittel zum Herleiten eines Einkanal-Audiosignals mit hergeleiteten Teilbandsignalen, hergeleitet von der ersten Anzahl unterabgetasteter Teilbandsignale und der zweiten Anzahl unterabgetasteter Teilbandsignale.
Anordnung zum Übertragen oder Speichern eines codierten Audiosignals auf Basis eines Eingangs-Audiosignals, wobei die Anordnung die nachfolgenden Elemente umfasst:

– eine Eingangseinheit zum Empfangen eines Eingangs-Audiosignals,

– einen Audiocodierer nach Anspruch 11 zum Codieren des Eingangs-Audiosignals zum Erhalten eines codierten Audiosignals,

– einen Kanalcodierer zum weiteren Codieren des codierten Audiosignals in ein Format, das zum Übertragen oder Speichern geeignet ist.
Verfahren zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal ein codiertes Einkanalaudiosignal und einen Satz räumlicher Parameter aufweist, wobei das Decodierverfahren die nachfolgenden Verfahrensschritte umfasst:

– das Decodieren des codierten Einkanalaudiosignals zum Erhalten einer Anzahl unterabgetasteter Teilbandsignale,

– weitere Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale in einer weiteren Filterbank um eine Anzahl Unterteilbandsignale zu schaffen, und

– das Herleiten zweier Audiokanäle aus den räumlichen Parametern, den Unterteilbandsignale und denjenigen unterabgetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden.
Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterung an wenigstens dem Teilbandsignal der Anzahl unterabgetasteter Teilbandsignale mit der niedrigsten Frequenz durchgeführt wird. Verfahren nach Anspruch 14, wobei die weitere Teilbandfilterung weiterhin an wenigstens dem Teilbandsignal der Anzahl unterabgetasteter Teilbandsignale mit der zweitniedrigsten Frequenz durchgeführt wird. Verfahren nach Anspruch 15, wobei die Anzahl Unterteilbänder in den Teilbandsignalen mit der niedrigsten Frequenz höher ist als die Anzahl Unterteilbänder in den Teilbandsignalen mit der zweitniedrigsten Frequenz. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterbank wenigstens teilweise eine komplex modulierte Filterbank ist. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterbank wenigstens teilweise eine reell bewertete Kosinusmodulierte Filterbank ist. Verfahren nach Anspruch 13, wobei die weitere Teilbandfilterbank eine unüblich gestapelte Filterbank ist. Verfahren nach Anspruch 13, wobei in dem Teilband mit der niedrigsten Frequenz Phasenänderungen gegenüber Unterteilbandsignalen mit einer negativen Mittenfrequenz in der Zeitdomäne dadurch ermittelt werden, dass das Negative der Phasenänderung genommen wird, die auf ein Unterteilbandsignal mit einer positiven Mittenfrequenz angewandt wurde, das im Absolutwert der genannten negativen Mittenfrequenz am nächsten liegt. Verfahren nach Anspruch 13, wobei das codierte Audiosignal Spektralband-Replikationsparameter aufweist und wobei ein HF-Anteil von der Anzahl unterabgetasteter Teilbandsignale und den Spektralband-Replikationsparametern hergeleitet wird, und wobei die zwei Audiokanäle von den räumlichen Parametern, den Unterteilbandsignalen, denjenigen unterangetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden und dem HF-Anteil hergeleitet werden. Audiodecoder zum Decodieren eines codierten Audiosignals, wobei das codierte Audiosignal ein codiertnes Einkanal-Audiosignal und einen Satz räumlicher Parameter aufweist, wobei der Audiodecoder die nachfolgenden Elemente umfasst:

– einen Decoder zum Decodieren des codierten Einkanalaudiosignals zum Erhalten einer Anzahl unterabgetasteter Teilbandsignale,

– eine weitere Filterbank zur weiteren Teilbandfilterung wenigstens eines der unterabgetasteten Teilbandsignale in einer weiteren Filterbank zum Schaffen einer Anzahl Unterteilbandsignale, und

– Mittel zum Herleiten zweier Audiokanäle aus den räumlichen Parametern, den Unterteilbandsignalen und diejenigen unterabgetasteten Teilbandsignalen, die nicht weiter teilbandgefiltert werden.
Anordnung zum Wiedergeben eines Ausgangsaudiosignals, wobei diese Anordnung Folgendes umfasst:

– eine Eingangseinheit zum Erhalten eines codierten Audiosignals,

– einen Audiodecoder nach Anspruch 22 zum Decodieren des codierten Audiosignals zum Erhalten des Ausgangsaudiosignals, und

– eine Wiedergabeeinheit, wie einen Lautsprecher- oder Kopfhörerausgang zum Wiedergeben des Ausgangsaudiosignals.
Computerprogrammprodukt mit einem Code zum Instruieren eines Computers zum Durchführen der Verfahrensschritte nach Anspruch 1 oder 13.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

  Patente PDF

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com