PatentDe  


Dokumentenidentifikation DE602004005020T2 31.10.2007
EP-Veröffentlichungsnummer 0001618763
Titel AUDIOSIGNALSYNTHESE
Anmelder Koninklijke Philips Electronics N.V., Eindhoven, NL
Erfinder SCHUIJERS, Erik G., NL-5656 AA Eindhoven, NL;
KLEIN MIDDELINK, Marc W., NL-5656 AA Eindhoven, NL;
OOMEN, Arnoldus W., NL-5656 AA Eindhoven, NL;
VAN DE KERKHOF, Leon M., NL-5656 AA Eindhoven, NL
Vertreter Volmer, G., Dipl.-Ing., Pat.-Anw., 52066 Aachen
DE-Aktenzeichen 602004005020
Vertragsstaaten AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LI, LU, MC, NL, PL, PT, RO, SE, SI, SK, TR
Sprache des Dokument EN
EP-Anmeldetag 14.04.2004
EP-Aktenzeichen 047273578
WO-Anmeldetag 14.04.2004
PCT-Aktenzeichen PCT/IB2004/050436
WO-Veröffentlichungsnummer 2004093495
WO-Veröffentlichungsdatum 28.10.2004
EP-Offenlegungsdatum 25.01.2006
EP date of grant 28.02.2007
Veröffentlichungstag im Patentblatt 31.10.2007
IPC-Hauptklasse G10L 19/00(2006.01)A, F, I, 20060816, B, H, EP
IPC-Nebenklasse H04S 5/00(2006.01)A, L, I, 20060816, B, H, EP   

Beschreibung[de]

Die Erfindung betrifft Synthetisieren eines Audiosignals und insbesondere eine Vorrichtung, welche ein Ausgangsaudiosignal liefert.

Der Artikel „Advances in Parametric Coding for High-Quality Audio", von Erik Schuijers, Werner Oomen, Bert den Brinker und Jeroen Breebaart, Preprint 5852, 114th AES Convention, Amsterdam, Niederlande, 22 bis 25. März 2003, offenbart ein parametrisches Codierschema unter Verwendung einer effizienten, parametrischen Repräsentation für die Stereoabbildung. Zwei Eingangssignale werden zu einem Monoaudiosignal vereinigt. Wahrnehmungsrelevante räumliche Hinweise werden explizit modelliert. Das vereinigte Signal wird unter Verwendung eines monoparametrischen Codierers codiert. Die Stereoparameter Kanalintensitätsdifferenz (Interchannel Intensity Difference, IID), Kanalzeitdifferenz (Interchannel Time Difference, ITD) und die Kanalkreuzkorrelation (Interchannel Cross-Correlation, ICC) werden quantisiert, codiert und zusammen mit dem quantisierten und codierten Monoaudiosignal in einem Bitstrom multiplexiert. Decodiererseitig wird der Bitstrom zu einem codierten Monosignal und den Stereoparametern demultiplexiert. Das codierte Monoaudiosignal wird decodiert, um ein decodiertes Monoaudiosignal m' zu erhalten (siehe 1). Aus dem Monozeitdomänensignal wird ein dekorreliertes Signal unter Verwendung eines Filters D 10 berechnet, welcher eine optimale Wahrnehmungsdekorrelation ergibt. Sowohl das Monozeitdomänensignal m' als auch das dekorrelierte Signal d werden in die Frequenzdomäne transformiert. Dann wird das Frequenzdomänenstereosignal mit den IID-, ITD- und ICC-Parametern durch Skalieren, Phasenmodifikationen bzw. Mischen in einer Parameterverarbeitungseinheit 11 verarbeitet, um das decodierte Stereopaar l' und r' zu erhalten. Die resultierenden Frequenzdomänenrepräsentationen werden in die Zeitdomäne zurücktransformiert.

Die deutsche Patentanmeldung DE 199 00 819 A1 offenbart ein System, wobei räumliche Informationen aus einem Datensignal extrahiert werden und mit einem Monosignal kombiniert werden, um einen künstlichen, räumlich verteilten Musikklang durch Trennung verschiedener Frequenzbänder und Anwendung verschiedener Zeitverzögerungen in der Zeitdomäne und Dämpfungspegel auf verschiedene Kanäle bereitzustellen.

Es ist eine Aufgabe der Erfindung ein Ausgangsaudiosignal auf der Grundlage eines Eingangsaudiosignals vorteilhaft zu synthetisieren. Zu diesem Zweck stellt die Erfindung ein Verfahren, eine Vorrichtung, ein Gerät und ein Computerprogrammprodukt bereit, wie in den selbständigen Ansprüchen definiert. Vorteilhafte Ausführungsformen werden in den abhängigen Ansprüchen definiert.

Gemäß einem ersten Gesichtspunkt der Erfindung wird ein Verfahren zum Synthetisieren eines Ausgangsaudiosignals nach Anspruch 1 bereitgestellt. Durch Bereitstellen eines Teilbands zum Frequenztransformieren in einem Teilband wird die Frequenzauflösung erhöht. Eine derartige erhöhte Frequenzauflösung weist den Vorteil auf, dass es möglich wird, eine hohe Audioqualität (die Bandbreite eines einzelnen Teilbandsignals ist typischerweise viel höher als die von kritischen Bändern in dem auditiven System beim Menschen) in einer effizienten Implementierung zu erzielen (weil nur einige wenige Bänder transformiert werden müssen). Ein Synthetisieren des Stereosignals in einem Teilband weist den weiteren Vorteil auf, dass es leicht mit vorhandenen, teilbandbasierten Audiocodierern kombiniert werden kann. Gewöhnlich werden Filterbänke in dem Kontext der Audiocodierung verwendet. Alle MPEG-1/2 Layers I, II und III verwenden einen kritisch abgetasteten 32-Band-Teilbandfilter.

Ausführungsformen der Erfindung sind besonders beim Erhöhen der Frequenzauflösung der niedrigeren Teilbänder unter Verwendung von Spektralbandreplikationsverfahren (Spectral Band Replication, „SBR") verwendbar.

Bei einer effizienten Ausführungsform wird eine Quadraturspiegelfilterbank (Quadrature Mirror Filter, „QMF") verwendet: Eine derartige Filterbank ist an sich bekannt aus dem Artikel „Bandwidth extension of audio signals by spectral band replication", von Per Ekstrand, Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), Seiten 53 bis 58, Leuven, Belgien, 15. November 2002. Die QMF-Synthesefilterbank nimmt die N komplexen Teilbandsignale als Eingang und erzeugt ein PCM-Ausgangssignal mit realen Werten. Das Konzept hinter SBR ist, dass die höheren Frequenzen aus den niedrigeren Frequenzen unter Verwendung nur sehr wenige r Hilfsinformationen rekonstruiert werden können. In der Praxis wird diese Rekonstruktion mittels einer komplexen Quadraturspiegelfilterbank (QMF) ausgeführt. Um wirksam zu einem dekorrelierten Signal in der Teilbanddomäne zu kommen, verwenden Ausführungsformen der Erfindung eine frequenz-(oder teilbandindex)-abhängige Verzögerung in der Teilbanddomäne, wie in der europäischen Patentanmeldung in dem Namen des Anmelders, eingereicht am 17. April 2003, mit dem Titel „Audio signal generation" (Patentanwaltsverzeichnis PH07NL030447), ausführlicher offenbart wird. Da die komplexe QMF-Filterbank nicht kritisch abgetastet wird, müssen keine zusätzlichen Vorkehrungen getroffen werden, um Aliasing Rechnung zu tragen. Es ist zu beachten, dass bei dem SBR-Decodierer, wie von Ekstrand offenbart, die QMF-Analysebank aus nur 32 Bändern besteht, während die QMF-Synthesebank aus 64 Bändern besteht, da der Kerndecodierer mit der halben Abtastfrequenz im Vergleich zu dem gesamten Audiodecodierer arbeitet. Bei dem entsprechenden Codierer wird jedoch eine 64-Band-QMF-Analysebank verwendet, um den ganzen Frequenzbereich abzudecken.

2 ist ein Blockdiagramm eines bandbreitenverbesserten (Bandwidth Enhanced, BWE) Decodierers, welcher das Spektralbandreplikationsverfahren (Spectral Band Replication, SBR) verwendet, wie in der MPEG-4-Norm ISO/IEC 14496-3:2001/FDAM1, JTC1/SC29/WG11, Coding of Moving Pictures and Audio, Bandwidth Extension, offenbart. Der Kernteil des Bitstroms wird unter Verwendung des Kerndecodierers decodiert, welcher z.B. ein standardmäßiger MPEG-1-Schicht-III-(mp3)- oder ein AAC-Decodierer sein kann. Typischerweise arbeitet ein derartiger Decodierer bei der halben Ausgangsabtastfrequenz (fs/2). Um die SBR-Daten mit den Kerndaten zu synchronisieren, wird eine Verzögerung "D" eingeführt (288 PCM-Abtastunger. in der MPEG-4-Norm). Das resultierende Signal wird in einen komplexen 32-Band-Quadraturspiegelfilter (QMF) eingespeist. Dieser Filter gibt 32 komplexe Abtastungen pro 32 realen Eingangsabtastungen aus und ist folglich um einem Faktor von 2 überabgetastet. In dem Hochfrequenz-(HF)-Erzeuger (man siehe 1) werden die höheren Frequenzen, welche von dem Kerncodierer nicht abgedeckt werden, durch Replizieren (bestimmter Teile) der niedrigeren Frequenzen erzeugt. Der Ausgang des Hochfrequenzerzeugers wird mit den niedrigeren 32 Teilbändern zu 64 komplexen Teilbandsignalen kombiniert. Nachfolgend stellt das Hüllkurveneinstellelement die replizierten Hochfrequenz-Teilbandsignale auf die erwünschte Hüllkurve ein und addiert zusätzliche Sinus- und Rauschkomponenten, wie von dem SBR-Teil des Bitstroms bezeichnet. Die Gesamtanzahl von 64 Teilbandsignalen wird durch den komplexen 64-Band-QMF-Synthesefilter gespeist, um das (reale) PCM-Ausgangssignal zu bilden.

Eine Anwendung von zusätzlichen Transformationen in einem Teilbandkanal führt eine bestimmte Verzögerung ein. In Teilbändern, bei welchen keine Transformation und Rücktransformation einbezogen ist, sollten Verzögerungen eingeführt werden, um einen Abgleich der Teilbandsignale zu erhalten. Ohne spezielle Maßnahmen führt die in den Teilbandsignalen so eingeführte, zusätzliche Verzögerung zu einer Fehljustierung (d.h. zu Synchronisationsverlust) der Kern- und Seiten- oder Hilfsdaten, wie beispielsweise der SBR-Daten oder der parametrischen Stereodaten. Im Fall der Teilbänder mit zusätzlicher Transformation/Rücktransformation und der Teilbänder ohne zusätzliche Transformation, sollte eine zusätzliche Verzögerung zu den Teilbändern ohne Transformation zugegeben werden. Innerhalb der SBR kann die zusätzliche Verzögerung, welche von der Transformations- und Rücktransformationsoperation bewirkt wird, von der Verzögerung D abgezogen werden.

Diese und andere Gesichtspunkte der Erfindung werden aus den hier nachfolgend beschriebenen Ausführungsformen offenkundig und unter Bezugnahme auf sie erklärt.

In den Zeichnungen zeigen:

1 ein Blockdiagramm eines parametrischen Stereodecodierers;

2 ein Blockdiagramm eines Audiodecodierers unter Verwendung der SBR-Technik;

3 eine parametrische Stereoverarbeitung in der Teilbanddomäne gemäß einer Ausführungsform der Erfindung;

4 ein Blockdiagramm, welches die Verzögerung illustriert, welche durch die Transformation-Rücktransformation TT–1 der 3 bewirkt wird;

5 einen vorteilhaften Audiodecodierer gemäß einer Ausführungsform der Erfindung, welche parametrisches Stereo bereitstellt, und

6 einen vorteilhaften Audiodecodierer gemäß einer Ausführungsform der Erfindung, welche parametrisches Stereo mit SBR komibiniert.

Die Zeichnungen zeigen nur diejenigen Elemente, welche nötig sind, um die Erfindung zu verstehen.

3 zeigt eine parametrische Stereoverarbeitung in der Teilbanddomäne gemäß einer Ausführungsform der Erfindung. Das Eingangssignal besteht aus N Eingangsteilbandsignalen. Bei praktischen Ausführungsformen beträgt N 32 oder 64. Die niedrigeren Frequenzen werden unter Verwendung der Transformation T transformiert, um eine höhere Frequenzauflösung zu erhalten, die höheren Frequenzen werden unter Verwendung der Verzögerung DT verzögert, um die Verzögerung zu kompensieren, welche durch die Transformation eingeführt wurde. Von jeden Teilbandsignal wird auch ein dekorreliertes Teilbandsignal mittels Verzögerungssequenz Dx erzeugt, wobei x der Teilbandindex ist. Die Blöcke P bezeichnen das Verarbeiten in zwei Teilbänder aus einem Eingangsteilbandsignal, wobei das Verarbeiten an einer transformierten Version des Eingangsteilbandsignals und an einer verzögerten und transformierten Version des Eingangsteilbandsignals durchgeführt wird. Das Verarbeiten kann Mischen, z.B. durch Rastern und/oder Drehen, der transformierten Version und der transformierten und verzögerten Version umfassen. Die Transformation T–1 bezeichnet die Rücktransformation. DT kann vor und nach Block P gespalten werden. Transformationen T können von verschiedener Länge sein, typischerweise weist eine geringe Frequenz eine längere Transformation auf, was bedeutet, dass zusätzlich auch eine Verzögerung in den Wegen eingeführt werden sollte, bei welchen die Transformation kürzer ist als die längste Transformation. Die Verzögerung D vor der Filterbank kann hinter die Filterbank verschoben werden. Wenn sie hinter der Filterbank angeordnet ist, kann sie teilweise entfernt werden, weil die Transformationen bereits eine Verzögerung einbeziehen. Die Transformation ist vorzugsweise vom Typ der modifizierten diskreten Cosinus-Transformation (Modified Discrete Cosine Transform, „MDCT"), obwohl auch andere Transformationen, wie beispielsweise eine schnelle Fourier-Transformation, verwendet werden können. Das Verarbeiten P führt gewöhnlich nicht zu einer zusätzlichen Verzögerung.

4 ist ein Blockdiagramm, welches die Verzögerung illustriert, welche von der Transformation-Rücktransformation TT–1 der 3 bewirkt wird. In 4 werden 18 komplexe Teilbandabtastungen durch ein Fenster h[n] unterteilt. Die komplexen Signale werden dann in den realen und imaginären Teil aufgespaltet, welche beide unter Verwendung der MDCT in zwei Mal 9 reale Werte transformiert werden. Die Rücktransformation von beiden Sätzen von 9 Werten führt erneut zu 18 komplexen Teilbandabtastungen, welche unterteilt werden und überlappend zu den vorhergehenden 18 komplexen Teilbandabtastungen addiert werden. Wie in dieser Figur illustriert, werden die letzten 9 komplexen Teilbandabtastungen nicht vollständig verarbeitet (d.h. überlappend addiert), was zu einer wirksamen Verzögerung von der halben Transformationslänge, d.h. von 9 (Teilband-)Abtastungen führt. Folglich sollte die Verzögerung in einem einzelnen Teilbandfilter in allen anderen Teilbändern kompensiert werden, bei welchen keine Transformation angewandt wird. Jedoch führt Einführen einer zusätzlichen Verzögerung zu den Teilbandsignalen vor der SBR-Verarbeitung (d.h. BF-Erzeugung und Hüllkurveneinstellung) zu einer Fehljustierung der Kern- und SBR-Daten. Um diesen Abgleich zu erhalten, kann die PCM-Verzögerung D, wie in 2 gezeigt, unmittelbar nach dem komplexen M-Band-Analyse-QMF angeordnet werden, was effektiv zu einer Verzögerung von D/M in jedem Teilband führt. Folglich ist die Anforderung zum Abgleich der Kern- und SBR-Daten, dass die Verzögerung in allen Teilbändern D/M beträgt. Deshalb kann, solange die Verzögerung DT der zugegebenen Transformation gleich oder kleiner als D/M ist, eine Synchronisation erhalten werden. Es ist zu beachten, dass die Verzögerungselemente in der Teilbanddomäne vom komplexen Typ werden. Bei praktischen SBR-Ausführungsformen ist M = 32. M kann auch gleich N sein.

Es ist zu beachten, dass bei praktischen Ausführungsformen jede Transformation T zwei MDCTs umfasst und jede Rücktransformation T–1 zwei [MDCTs umfasst, wie oben stehend beschrieben.

Die niedrigeren Teilbänder, bei welchen die Transformation T eingeführt wird, werden von dem Kerndecodierer abgedeckt. Obwohl sie jedoch nicht von dem Hüllkurveneinstellelement des SBR-Werkzeugs verarbeitet werden, kann der Hochfrequenzerzeuger des SBR-Werkzeugs ihre Abtastungen bei dem Replikationsprozess erfordern. Deshalb müssen die Abtastungen dieser niedrigeren Teilbänder auch nicht transformiert' verfügbar sein. Dies erfordert eine zusätzliche (wieder komplexe) Verzögerung von DT Teilbandabtastungen in diesen Teilbändern. Die Mischoperation, welche auf den realen Werte und auf den komplexen Werten der komplexen Abtastungen durchgeführt wird, kann gleich sein.

5 zeigt einen vorteilhaften Audiodecodierer gemäß einer Ausführungsform der Erfindung, welche parametrisches Stereo bereitstellt. Der Bitstrom wird in Monoparameter/-koeffiizienten und Stereoparameter aufgespaltet. Zuerst wird ein herkömmlicher Monodecodierer verwendet, um das (rückwärts kompatible) Monosignal zu erhalten. Dieses Signal wird mittels einer Teilbandfilterbank analysiert, welche das Signal in eine Anzahl Teilbandsignale aufspaltet. Die Stereoparameter werden verwendet, um die Teilbandsignale zu zwei Sätzen von Teilbandsignalen zu verarbeiten, einen für den linken und einen für den rechten Kanal. Unter Verwendung von zwei Teilbandsynthesefiltern werden diese Signale in die Zeitdomäne transformiert, was zu einem Stereo-(linken und rechten) Signal führt. Der Stereoverarbeitungsblock wird in 3 gezeigt.

6 zeigt einen vorteilhaften Audiodecodierer gemäß einer Ausführungsform der Erfindung, welche parametrisches Stereo mit SBR kombiniert. Der Bitstrom wird in Monoparameter/-koeffizienten, SBR-Parameter und Stereoparameter aufgespaltet. Zuerst wird ein herkömmlicher Monodecodierer verwendet, um des (rückwärts kompatible) Monosignal zu erhalten. Dieses Signal wird mittels einer Teilbandfilterbank analysiert, welche das Signal in eine Anzahl Teilbandsignale aufspaltet. Durch Verwendung der SBR-Parameter wird mehr HF-Gehalt erzeugt, wobei möglicherweise mehr Teilbänder als bei der Analysefilterbank verwendet werden. Die Stereoparameter werden verwendet, um die Teilbandsignale zu zwei Sätzen vor Teilbandsignalen zu verarbeiten, einen für den linken und einen für den rechten Kanal. Durch Verwendung von zwei Teilbandsynthesefiltern werden diese Signale in die Zeitdomäne transformiert, was zu einem Stereo-(linken und rechten)-Signal führt. Der Stereoverarbeitungsblock wird in dem Blockdiagramm der 3 gezeigt.

Es sollte angemerkt werden, dass die oben stehend beschriebenen Ausführungsformen die Erfindung illustrieren, statt sie einzuschränken, und dass Durchschnittsfachleute in der Lage sind, viele alternative Ausführungsformen zu entwerfen, ohne den Schutzumfang der angefügten Ansprüche zu verlassen. In den Ansprüchen ist kein Bezugszeichen, welches zwischen Klammern angeordnet ist, vorgesehen, den Anspruch einzuschränken. Eine Verwendung des unbestimmten Artikels „ein" oder „eine" vor einem Element oder Schritt schließt die Gegenwart mehrerer derartiger Elemente oder Schritte nicht aus. Die Verwendung des Verbs "umfassen" und seiner Konjugationen schließt die Gegenwart von anderen Elementen oder Schritten als denjenigen, welche in einem Anspruch spezifiziert werden, nicht aus. Die Erfindung kann mittels Hardware, welche einige distinkte Elemente umfasst, und mittels eines geeignet programmierten Computers implementiert werden. In einem Geräteanspruch, welcher einige Mittel aufzählt, können einige dieser Mittel durch einen und den gleichen Hardware-Gegenstand ausgeführt werden. Die bloße Tatsache, dass bestimmte Maßnahmen in sich voneinander unterscheidenden abhängigen Ansprüchen aufgeführt werden, zeigt nicht an, dass eine Kombination dieser Maßnahmen nicht vorteilhaft verwendet werden kann.

Legende der Zeichnungen Fig. 1:

  • parameter processing – Parameterverarbeitung
  • stereo parameters – Stereoparameter

Fig. 2:

  • bit-stream – Bitstrom
  • core decoder – Kerndecodierer
  • 32 bands complex QMF – komplexer 32-Band-QMF
  • HF generator – HF-Erzeuger
  • envelope adjuster – Hüllkurveneinstellelement
  • 64 bands complex QMF – komplexer 64-Band-QMF
  • PCM output – PCM-Ausgang

Fig. 3:

  • sub band input – Teilbandeingang
  • sub band output – Teilbandausgang
  • right – rechts
  • left – links
  • parameters – Parameter

Fig. 4:

  • 18 complex sub band samples – 18 komplexe Teilbandabtastungen
  • window – Fenster
  • real – real
  • imaginary – imaginär
  • 9 real values – 9 reale Werte
  • overlap add – überlappendes Addieren
  • not fully processed samples – nicht vollständig verarbeitete Abtastungen

Fig. 5:

  • bit-stream – Bitstrom
  • bit-stream de-multiplexer – Bitstromdemultiplexer
  • mono decoder – Monodecodierer
  • mono signal – Monosignal
  • sub-band analysis filter – Teilbandanalysefilter
  • stereo parameters – Stereoparameter
  • stereo processing – Stereoverarbeitung
  • left s.b. signal – linkes Teilbandsignal
  • right s.b. signal – rechtes Teilbandsignal
  • sub-band synthesis filter – Teilbandsynthesefilter
  • left signal – linkes Signal
  • right signal – rechtes Signal

Fig. 6:

  • bit-stream – Bitstrom
  • bit-stream de-multiplexer – Bitstromdemultiplexer
  • mono decoder – Monodecodierer
  • mono signal – Monosignal
  • sub-band analysis filter – Teilbandanalysefilter
  • SBR parameters – SBR-Parameter
  • s.b. signals – Teilbandsignale
  • stereo parameters – Stereoparameter
  • stereo processing – Stereoverarbeitung
  • left s.b. signal – linkes Teilbandsignal
  • right s.b. signal – rechtes Teilbandsignal
  • sub-band synthesis filter – Teilbandsynthesefilter
  • left signal – linkes Signal
  • right signal – rechtes Signal


Anspruch[de]
Verfahren zum Synthetisieren eines Ausgangsaudiosignals auf der Grundlage eines Zeitdomänen-Eingangsaudiosignals, das Verfahren die folgenden Schritte umfassend:

– Transformieren des Zeitdomänen-Eingangsaudiosignals in ein Teilbanddomänen-Eingangssignal, welches mehrere Eingangsteilbandsignale umfasst;

– Transformieren (T) mindestens eines Eingangsteilbandsignals aus der Teilbanddomäne in eine Frequenzdomäne mit höherer Auflösung, um mindestens ein jeweiliges transformiertes Signal zu erhalten,

– Verzögern (D0...n) und Transformieren des mindestens einen Eingangsteilbandsignals in die Frequenzdomäne mit höherer Auflösung, um mindestens ein jeweiliges transformiertes verzögertes Signal zu erhalten;

– Ableiten (P) von mindestens zwei verarbeiteten Signalen aus einem Mischen des mindestens einen transformierten Signals und des mindestens einen transformierten verzögerten Signals,

– Rücktransformieren (T–1) der verarbeiteten Signale aus der Frequenzdomäne mit höherer Auflösung in die Teilbanddomäne, um jeweilige verarbeitete Teilbandsignale zu erhalten, und

– Synthetisieren des Ausgangsaudiosignals aus den verarbeiteten Teilbandsignalen, wobei das Synthetisieren ein Transformieren aus der Teilbanddomäne in die Zeitdomäne umfasst.
Verfahren nach Anspruch 1, wobei das Transformieren ein Cosinus-Transformieren ist und das Rücktransformieren ein inverses Cosinus-Transformieren ist. Verfahren nach Anspruch 1, wobei die Eingangsteilbandsignale komplexe Abtastungen umfassen und wobei ein realer Wert einer gegebenen komplexen Abtastung in einer ersten Transformation transformiert wird und ein komplexer Wert der gegebenen komplexen Abtastung in einer zweiten Transformation transformiert wird. Verfahren nach Anspruch 3, wobei die erste Transformation und die zweite Transformation separate aber gleiche Transformationen sind. Verfahren nach Anspruch 1, wobei das Verarbeiten eine Rasteroperation umfasst. Verfahren nach Anspruch 1, wobei das Verarbeiten eine Drehungsoperation umfasst. Verfahren nach Anspruch 1, wobei das mindestens eine Teilbandsignal das Teilbandsignal mit der niedrigsten Frequenz aufweist. Verfahren nach Anspruch 7, wobei das mindestens eine Teilbandsignal aus 2 bis 8 Teilbandsignalen besteht. Verfahren nach Anspruch 1, wobei der Schritt des Synthetisierens in einer Teilbandfilterbank zum Synthetisieren einer Zeitdomänenversion des Ausgangsaudiosignals aus den verarbeiteten Teilbandsignalen durchgeführt wird. Verfahren nach Anspruch 9, wobei die Teilbandfilterbank eine komplexe Teilbandfilterbank ist. Verfahren nach Anspruch 9, wobei die komplexe Teilbandfilterbank eine komplexe Quadraturspiegelfilterbank ist. Verfahren nach Anspruch 1, wobei das Eingangsaudiosignal ein Monoaudiosignal ist und das Ausgangsaudiosignal ein Stereoaudiosignal ist. Verfahren nach Anspruch 1, das Verfahren weiterhin der folgenden Schritt umfassend:

– Erhalten eines Korrelationsparameters, welcher für eine erwünschte Korrelation zwischen einem ersten Kanal und einem zweiten Kanal des Ausgangsaudiosignals bezeichnend ist, wobei das Verarbeiten eingerichtet ist, um die verarbeiteten Signale durch Kombinieren des transformierten Signals und des transformierten verzögerten Signals in Abhängigkeit von dem Korrelationsparameter zu erhalten, und wobei der erste Kanal aus einem ersten Satz der verarbeiteten Signale und der zweite Kanal aus einem zweiten Satz der verarbeiteten Signale abgeleitet wird.
Verfahren nach Anspruch 13, wobei jedes verarbeitete Signal mehrere Ausgangsteilbandsignale umfasst und wobei ein erster Zeitdomänenkanal und ein zweiter Zeitdomänenkanal auf der Grundlage der jeweiligen Ausgangsteilbandsignale vorzugsweise in jeweiligen Syntheseteilbandfilterbänken synthetisiert werden. Verfahren nach Anspruch 1, wobei das Verfahren weiterhin die folgenden Schritte umfasst:

– Ableiten von M-Teilbändern, um M gefilterte Teilbandsignale auf der Grundlage eines Zeitdomänen-Kernaudiosignals zu erzeugen,

– Erzeugen einer Hochfrequenz-Signalkomponente, welche aus den M gefilterten Teilbandsignalen abgeleitet ist, wobei die Hochfrequenz-Signalkomponente N-M Teilbandsignale aufweist, wobei N > M ist, wobei die N-M Teilbandsignale Teilbandsignale mit einer höheren Frequenz umfassen als jedes der Teilbänder in den M Teilbändern, wobei die M gefilterten Teilbänder und die N-M Teilbänder zusammen die mehreren Eingangsteilbandsignale bilden.
Vorrichtung zum Synthetisieren eines Ausgangsaudiosignals auf der Grundlage eines Zeitdomänen-Eingangsaudiosignals, die Vorrichtung Folgendes umfassend:

– Mittel zum Transformieren des Zeitdomänen-Eingangsaudiosignals in ein Teilbanddomänen-Eingangssignal, welches mehrere Eingangsteilbandsignale umfasst;

– Mittel zum Transformieren (T) mindestens eines Eingangsteilbandsignals aus der Teilbanddomäne in eine Frequenzdomäne mit höherer Auflösung, um mindestens ein jeweiliges transformiertes Signal zu erhalten,

– Mittel zum Verzögern (D0...n) und Transformieren des mindestens einen Eingangsteilbandsignals in die Frequenzdomäne mit höherer Auflösung, um mindestens ein jeweiliges transformiertes verzögertes Signal zu erhalten;

– Mittel zum Ableiten (P) von mindestens zwei verarbeiteten Signalen aus einem Mischen des mindestens einen transformierten Signals und des mindestens einen transformierten verzögerten Signals,

– Mittel zum Rücktransformieren (T–1) der verarbeiteten Signale aus der Frequenzdomäne mit höherer Auflösung in die Teilbanddomäne, um jeweilige verarbeitete Teilbandsignale zu erhalten, und

– Mittel zum Synthetisieren des Ausgangsaudiosignals aus den verarbeiteten Teilbandsignalen, wobei das Synthetisieren ein Transformieren aus der Teilbanddomäne in die Zeitdomäne umfasst.
Vorrichtung zum Liefern eines Ausgangsaudiosignals, die Vorrichtung umfassend:

– eine Eingangseinheit zum Erhalten eines codierten Audiosignals,

– einen Decodierer zum Decodieren des codierten Audiosignals, um ein decodiertes Signal zu erhalten, welches mehrere Teilbandsignale aufweist,

– eine Vorrichtung nach Anspruch 16 zum Erhalten des Ausgangsaudiosignals auf der Grundlage des decodierten Signals, und

– eine Ausgangseinheit zum Liefern des Ausgangsaudiosignals.
Computerprogrammprodukt, welches einen Code zum Anweisen eines Computers aufweist, um die folgenden Schritte durchzuführen:

– Transformieren eines Zeitdomänen-Eingangsaudiosignals in ein Teilbanddomänen-Eingangssignal, welches mehrere Eingangsteilbandsignale umfasst;

– Transformieren (T) mindestens eines Eingangsteilbandsignals aus der Teilbanddomäne in eine Frequenzdomäne mit höherer Auflösung, um mindestens ein jeweiliges transformiertes Signal zu erhalten,

– Verzögern (D0...n) und Transformieren des mindestens einen Eingangsteilbandsignals in die Frequenzdomäne mit höherer Auflösung, um mindestens ein jeweiliges transformiertes verzögertes Signal zu erhalten;

– Ableiten (P) von mindestens zwei verarbeiteten Signalen aus einem Mischen des mindestens einen transformierten Signals und des mindestens einen transformierten verzögerten Signals,

– Rücktransformieren (T–1) der verarbeiteten Signale aus der Frequenzdomäne mit höherer Auflösung in die Teilbanddomäne, um jeweilige verarbeitete Teilbandsignale zu erhalten, und

– Synthetisieren des Ausgangsaudiosignals aus den verarbeiteten Teilbandsignalen, wobei das Synthetisieren ein Transformieren aus der Teilbanddomäne in die Zeitdomäne umfasst.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com