PatentDe  


Dokumentenidentifikation DE102006059764A1 07.02.2008
Titel Signalverarbeitung
Anmelder Noveltech Solutions OY, Turku, FI
Erfinder Kauppinen, Ismo, Ilmarinen, FI
Vertreter Patent- und Rechtsanwälte Kraus & Weisert, 80539 München
DE-Anmeldedatum 18.12.2006
DE-Aktenzeichen 102006059764
Offenlegungstag 07.02.2008
Veröffentlichungstag im Patentblatt 07.02.2008
IPC-Hauptklasse H04S 1/00(2006.01)A, F, I, 20071001, B, H, DE
Zusammenfassung Die vorliegende Erfindung betrifft eine Audiosignalverarbeitung. Erfindungsgemäß wird eine auto-regressive (AR) Modellierung (10) eingesetzt, um eine Residuumsignal von einem Eingangsaudiosignal zu erzeugen. Das Residuumsignal wird weiter dem Eingangsaudiosignal hinzugeführt (30), um ein verarbeitetes Ausgangsaudiosignal zu erzeugen.

Beschreibung[de]
BEREICH DER ERFINDUNG

Die vorliegende Erfindung betrifft ein Gebiet der Signalverarbeitung und insbesondere Systeme, Verfahren, Vorrichtungen und Computerprogrammanwendungen zur Verarbeitung bzw. Bearbeitung eines Audiosignals.

HINTERGRUND DER ERFINDUNG

Die Autosignalverarbeitung wird z.B. bei industriellen Prozessen, wie z.B. bei Systemen zur Prozesssteuerung und Zustandsüberwachung, und bei Audiosystemen, wie z.B. bei einer Klangbearbeitung, um ein Audiosignal zu bearbeiten, verbreitet eingesetzt. Die Audiosignalverarbeitung wird auch verbreitet bei der Telekommunikation eingesetzt.

Bei der Audiosignalverarbeitung, z.B. bei der Klangbearbeitung, ist es, z.B. beim Mischen und beim Mastering, wichtig, bestimmte Eigenschaften des Klangs zu verbessern. Dies geschieht zum Beispiel beim Abmischen von Musik, um insgesamt einen besseren Klangabgleich nach dem endgültigen Abmischen zu erhalten und eine Trennung der Klangkomponenten, d.h. von Instrumenten, nach dem endgültigen Abmischen zu verbessern.

Bei einer heutigen Klangbearbeitung werden mehrere Verarbeitungswerkzeuge eingesetzt, um die erwünschten Ergebnisse zu erzielen. Diese Werkzeuge umfassen typischerweise z.B. ein Filtern, eine dynamische Verarbeitung und eine Erzeugung von Klangeffekten. Das Filtern, welches auch Entzerren genannt wird, verändert die Frequenzantwort der Quelle. Die dynamische Verarbeitung verändert die dynamischen Eigenschaften des Quellenmaterials, was zumindest ein Gate, einen Kompressor, einen Begrenzer und einen Expander umfasst. Klangeffekterzeuger umfassen Prozessoren, wie z.B. einen Verzerrer, einen Chorus, ein Delay und einen Flanger.

Die vorab erwähnten heutigen Klangbearbeitungswerkzeuge werden über verschiedene von einer Bedienperson steuerbare Parameter gesteuert. Bei einem typischen Fall einer Klangbearbeitung tritt das Problem auf, dass eine gewaltige Anzahl von Parametern durch eine Bedienperson des Systems korrekt eingestellt werden muss, um das erwünschte Ergebnis zu erzielen. Dies macht die Klangbearbeitung sehr zeitaufwändig und erfordert ein großes Wissen und eine große Erfahrung von einer Person, welche eine Klangbearbeitungsvorrichtung einsetzt, um geeignete Ergebnisse zu erzielen.

KURZE ZUSAMMENFASSUNG DER ERFINDUNG

Erfindungsgemäße Ausführungsformen stellen ein Computerprogrammprodukt, eine Vorrichtung, ein System, ein Verfahren und eine Benutzerschnittstelle zur Verarbeitung eines Audiosignals bereit.

Natürlich liegt ein Audiosignal, wenn es erfindungsgemäß verarbeitet wird, typischerweise in einer Form vor, welche an sich nicht hörbar ist. Z.B. kann das Signal in einer digitalen Form durch ein Computerprogramm verarbeitet werden. Daher bedeutet bei einigen erfindungsgemäßen Ausführungsformen ein "Audiosignal", dass das Signal, welches erfindungsgemäß verarbeitet wird, ein Audiosignal ist oder zumindest ein Audiosignal darstellt. Bei einigen erfindungsgemäßen Ausführungsformen bedeutet ein "Audiosignal", dass das Signal, welches erfindungsgemäß verarbeitet wird, ein Audiosignal ist, welches von einem Menschen hörbar ist, oder zumindest ein solches darstellt. Einige Beispiele eines erfindungsgemäßen Audiosignals sind menschliche Stimmen, Geräusche, welche von Tieren erzeugt werden, oder Klänge, welche durch Musikinstrumente erzeugt werden.

Bei einer erfindungsgemäßen Ausführungsform ist ein Computerprogramm oder ein Computerprogrammprodukt derart definiert, dass es ein Audiosignal verarbeitet. Das Computerprogrammprodukt umfasst ein von einem Computer lesbares Speichermedium mit Computer-lesbaren Programmanweisungen, welche in dem Medium enthalten sind. Die Computer-lesbaren Programmanweisungen umfassen erste Anweisungen, um eine auto-regressive (AR) Modellierung einzusetzen, um ein Residuumsignal bzw. Residualtonsignal für ein Eingangsaudiosignal zu erzeugen, und zweite Anweisungen, um das Residualtonsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen. Der Residualton ist auch als der Vorhersagefehler einer linearen prädiktiven Codierung (LPC) bekannt. Die Verarbeitung kann in Echtzeit erfolgen und kann über einige Parameter gesteuert werden. Die erfindungsgemäße Anwendung kann bei einer Signalverarbeitungsvorrichtung oder einem Signalverarbeitungssystem ausgeführt werden oder sie kann in einer abgesetzten Netzwerkvorrichtung oder in einem abgesetzten Netzwerksystem ausgeführt werden, welches sich über ein Netzwerk in Verbindung mit der Signalverarbeitungsvorrichtung oder dem Signalverarbeitungssystem befindet.

Das Computerprogrammprodukt zur Bereitstellung einer Audiosignalverarbeitung kann auch dritte Anweisungen umfassen, für zumindest eine Verarbeitung aus

  • – einer Vorbearbeitung des Eingangsaudiosignals und
  • – einer Nachbearbeitung des Ausgangsaudiosignals.

Eine Vorbearbeitung und eine Nachbearbeitung des Audiosignals kann zumindest eines umfassen aus: einer Niveauanpassung, einer Filterung, einer dynamischen Verarbeitung und einer Erzeugung von Klangeffekten.

Die Erfindung ist auch durch einen Signalprozessor definiert, welcher mindestens umfasst eine Verarbeitungseinheit, um ein Residualtonsignal von einem Eingangssignal zu erzeugen, wobei eine auto-regressive (AR) Modellierung eingesetzt wird, und eine Mischeinheit, um das Residualtonsignal zu dem Eingangssignal hinzuzufügen, um ein verarbeitetes Ausgangssignal zu erzeugen.

Die Erfindung ist auch durch eine Signalverarbeitungsvorrichtung definiert, welche mindestens umfasst eine Empfangseinheit, welche derart ausgestaltet ist, dass sie ein Eingangsaudiosignal empfängt, eine Verarbeitungseinheit, um ein Residualtonsignal von einem Eingangsaudiosignal zu erzeugen, wobei eine autoregressive (AR) Modellierung eingesetzt wird, eine Mischeinheit, um das Residualtonsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen, und eine Ausgangseinheit, welche derart ausgestaltet ist, dass sie einen Ausgang für das Ausgangsaudiosignal bereitstellt.

Die Erfindung ist auch durch ein System zur Signalverarbeitung definiert. Gemäß einer erfindungsgemäßen Ausführungsform umfasst das System eine Spannungszufuhr. Darüber hinaus umfasst das System zumindest einen digitalen Eingang und/oder einen analogen Eingang und zumindest einen digitalen und/oder analogen Ausgang. Analog-Digital-Wandler werden bei einigen Ausführungsformen benötigt, um analoge Eingangssignale in digitale Eingangssignale zu wandeln. Auf ähnliche Weise werden Digital-Analog-Wandler bei einigen Ausführungsformen benötigt, um digitale Ausgangsignale in analoge Ausgangssignale zu wandeln. Darüber hinaus umfasst das System einen Prozessor, welcher zumindest umfasst eine Verarbeitungseinheit, um ein Residualtonsignal von einem Eingangsaudiosignal zu erzeugen, wobei eine auto-regressive (AR) Modellierung eingesetzt wird, und eine Mischeinheit, um das Residualtonsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen. Des Weiteren umfasst das System zumindest eine Steuerung, um AR-Modellierungsvariablen zu beeinflussen, welche bei der Erzeugung des Residualtonsignals verwendet werden.

Die Signalverarbeitungsvorrichtung oder das Signalverarbeitungssystem zur Signalverarbeitung kann z.B. als eine an einem Gestell bzw. einem Rack montierte Vorrichtung, als ein Pedal, wie z.B. als ein Gitarrenpedal, als ein Pedalinstrument, als eine digitale Mischkonsole, als ein Verstärker, als ein Vorprozessor, als ein Computer, als ein Netzserver, als ein Synthesizer oder als irgendeine andere stationäre oder tragbare Signalverarbeitungsvorrichtung ausgestaltet sein.

Darüber hinaus kann die Signalverarbeitungsvorrichtung eine Steuereinheit in Verbindung mit der Verarbeitungseinheit umfassen, wobei die Steuereinheit einer Bedienperson eine Steuerung einer oder mehrerer Variablen, welche bei der AR-Modellierung verwendet werden, bereitstellt.

Die Erfindung ist auch durch eine Benutzerschnittstellenanwendung für eine Verarbeitungseinheit definiert, um ein Residualtonsignal von einem Eingangsaudiosignal zu erzeugen, wobei eine auto-regressive (AR) Modellierung eingesetzt wird. Gemäß einer Ausführungsform umfasst die Benutzerschnittstellenanwendung:

  • – erste Anweisungen, um einer Bedienperson eine oder mehrere Audiosignalverarbeitungsoptionen darzustellen, und
  • – zweite Anweisungen, um AR-Modellierungsvariablen, welche bei der Erzeugung der Residualtoneingaben verwendet werden, auf der Grundlage von Eingaben der Bedienperson bezüglich der dargestellten Audiosignalverarbeitungsoptionen zu beeinflussen.

Die dargestellten Audiosignalverarbeitungsoptionen können zusätzliche Optionen umfassen, um eines oder mehreres zu steuern, welches ausgewählt ist aus der Vorbearbeitung eines Eingangsaudiosignals, der Nachbearbeitung eines Ausgangsaudiosignals, dem Mischen eines Residualtonsignals zu einem Eingangsaudiosignal, dem Niveau des Eingangsaudiosignals und dem Niveau des Ausgangsaudiosignals. Die Benutzerschnittstellenanwendung kann ein Computerprogrammprodukt sein, welches in den internen Speicher eines digitalen Computers geladen werden kann, welches Softwarecodeabschnitte umfasst, um zumindest einen Teil der vorab erwähnten Schritte auszuführen, wenn das Produkt auf einem Computer läuft.

Die Erfindung ist auch durch ein Verfahren zur Signalverarbeitung definiert, welches zumindest die Schritte umfasst

  • – Verwenden einer auto-regressiven (AR) Modellierung, um ein Residualtonsignal von einem Eingangsaudiosignal zu erzeugen, und
  • – Hinzufügen des Residualtonsignals zu dem Eingangsaudiosignal, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen.

Bei einer erfindungsgemäßen Ausführungsform ist das Audiosignal ein von einem Menschen hörbares Signal.

Bei einer erfindungsgemäßen Ausführungsform ist das Audiosignal ein Signal in dem Frequenzbereich von 0–20.000 Hz oder in dem Frequenzbereich von 20–20.000 Hz.

Dadurch mildert die vorliegende Erfindung Probleme, welche sich auf eine Signalverarbeitung beziehen, speziell welche sich auf eine Audiosignalverarbeitung beziehen, ab. Die vorliegende Erfindung adressiert auch das Bedürfnis, Bedienpersonen mit Signalverarbeitungsoptionen zu versehen, um einen Klang eines Audiosignals speziell bezüglich des Mischens und Masterings zu verbessern. Der Anmelder hat erkannt, dass das Residualtonsignal eines Audiosignals solche Komponenten eines Klangs enthält, welche verwendbar sind, um den Klang eines Audiosignals bei einer Klangbearbeitung zu verbessern. Daher ist ein Vorteil der vorliegenden Erfindung, dass der Klang eines Audiosignals effektiv verändert werden kann und Verarbeitungsergebnisse für das Mischen und das Masterring sofort und steuerbar erzielt werden können.

KURZE BESCHREIBUNG DER ZEICHNUNGEN

Nachdem die Erfindung in allgemeinen Begriffen beschrieben worden ist, wird nun Bezug auf die beigefügten Zeichnungen genommen, welche nicht notwendigerweise maßstabsgetreu gezeichnet sind.

1 ist ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer erfindungsgemäßen Ausführungsform.

2 ist ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer erfindungsgemäßen Ausführungsform.

3 ist ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer erfindungsgemäßen Ausführungsform.

4 ist ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer erfindungsgemäßen Ausführungsform.

5 ist ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer erfindungsgemäßen Ausführungsform.

6 stellt schematisch eine Benutzerschnittstelle gemäß einer erfindungsgemäßen Ausführungsform dar.

DETAILLIERTE BESCHREIBUNG DER ERFINDUNG

Im Folgenden wird die Erfindung im Zusammenhang mit einer Audiosignalverarbeitung beschrieben. Die Erfindung kann eingesetzt werden, um Audiosignale in verschiedenen Systemen zu verarbeiten, wobei das Gebiet der Unterhaltung, der Telekommunikation, industrielle Prozesse und andere Systeme, unabhängig davon, ob es sich um digitale oder analoge Audiosignale handelt, eingeschlossen sind. Ein Fachmann kann die Ausführungsformen auf Systeme anwenden, welche entsprechende Eigenschaften aufweisen.

Eine auto-regressive Modellierung von gemessenen Daten wird im Allgemeinen bei zahlreichen Signalverarbeitungsanwendungen eingesetzt. Ein autoregressives (AR) Modell wird definiert durch eine Gleichung

wobei yn die Signalwerte, p die Ordnung des Modells, am die Koeffizienten des Modells und en das Residuum ist. Die Modellkoeffizienten am werden berechnet, indem die Gesamtenergie des Residuums E = &Sgr;ne2n(2) minimiert wird.

Es gibt mehrere Verfahren, um die AR-Parameter zu schätzen. Das Fehlerquadratverfahren (auch als das Kovarianzverfahren bekannt) und das Yule-Walker-Verfahren (auch als das Autokorrelationsverfahren bekannt) sind die aus historischen Gründen am häufigsten eingesetzten Ansätze, wie es Hoon in [1] ausführt. Es ist allgemein bekannt, dass das Burg's Verfahren vorzugsweise für Anwendungen berücksichtigt wird, welche Modelle einer hohen Genauigkeit erfordern, wie z.B. eine Signalextrapolation [2] und eine Signalerfassung [1].

Gemäß einer erfindungsgemäßen Ausführungsform können die AR-Parameter unter Verwendung des Burg's Algorithmus berechnet werden. Aus Gl. (1) ist bekannt, dass das Residuum en von dem Signal yn berechnet werden kann durch

wobei a0 = 1 ist. Wenn die Signalrahmen aus N Werten Y0, Y1, ..., yN-1 bestehen, können die Residuum-Werte ep, ep+1, ...,eN-1 als die Ausgabe eines Vorhersagefehlerfilters mit endlicher Impulsantwort (FIR) angesehen werden. Dieser FIR-Filter kann durch eine Allpassstruktur implementiert werden. Die Gleichungen des Allpassfilters sind f(l)n = f(l-1)n + klb(l-1)n-1b(l)n = b(l-1)n-1 + klf(l-1)n(4) n = l, l + 1,..., N-1 wobei f(l)n und b(l)n Forward- und Backward-Vorhersagefehler und kl Reflexionskoeffizienten der Stufe I sind. Die Anfangswerte für die Residuen sind f(0)n = b(0)n = yn . Burg's Algorithmus berechnet die Reflexionskoeffizienten kl so, dass sie die Summe der Forward- und Backward-Residuumfehler minimieren [3]. Dies impliziert eine Vermutung, dass dieselben AR-Koeffizienten das Signal vorwärts und rückwärts vorhersagen können. Die Summe von Residuumenergien bei einer Stufe I ist

Eine Minimierung von EI bezüglich der Reflexionskoeffizienten kI ergibt

was nach den Reflexionskoeffizienten aufgelöst werden kann, d.h.

Die AR-Koeffizienten am können aus den Reflexionskoeffizienten kI über den Levinson-Durbin-Algorithmus ermittelt werden. Die Rekursion wird mit a(0)0 = 1 initialisiert und a(l)m = a(l-1)m + kla(l-1)l-ma(l)l = kl(8) m = 1,2,..., l-1

für I = 1, 2,..., p wiederholt. Am Ende der Iterationen ergibt a(p)m die erwünschten Vorhersagefehlerfilterkoeffizienten am der Gl. (3). Die Gleichung (7) stellt sicher, dass |kl| < 1 gilt und daher wird garantiert, dass Burg's Verfahren ein stabiles Modell bereitstellt.

Gemäß einer erfindungsgemäßen Ausführungsform wird eine Frequenzverzerrung bzw. Frequenz-Warping bei der AR-Modellierung eingesetzt. Dies ergibt einige Vorteile, speziell wenn die Energieverteilung des Signals in dem niedrigeren oder höheren Frequenzbereich konzentriert ist. Früher ist eine frequenzverzerrte bzw. Frequency-warped Version des Yule-Walker-Verfahrens erfolgreich bei mehreren Audio-Anwendungen eingesetzt worden [4]. Andere Anwendungen des Frequenzverzerrens umfassen eine Analyse, eine Synthese und eine Rauschunterdrückung von Audiosignalen [5].

Die Darstellung im Zeitbereich eines Signals steht über die Fourier-Transformation mit seinem Spektrum in Beziehung. Die Frequenzauflösung des sich ergebenden Spektrums ist entlang der Frequenzachse gleichförmig. Eine Signalanalyse bei nicht gleichförmigen Frequenzauflösungen oder bei bezüglich der Frequenz verzerrten Skalen kann mittels eines Frequenzabbildungsoperators erzielt werden. Dies bedeutet grundsätzlich, dass die Einheitsverzögerungen, z{–1}, der eingesetzten Filterstrukturen mit Allpassfiltern erster Ordnung, D(z), ersetzt werden. Diese Allpassfilter können als frequenzabhängige Verzögerungselemente betrachtet werden und sind definiert durch

Im Gegensatz zu der linearen Phasenantwort einer gewöhnlichen Einheitsverzögerung, kann die Phasenantwort von D(z) nicht linear ausgeführt sein, indem der Verzerrungsfaktorparameter bzw. Warping-Faktor-Parameter &lgr; eingestellt wird. Allerdings wird die Abbildung von der gleichförmigen zu der frequenzverzerrten Skala durch die Phasenantwort von D(z) bestimmt, welche gegeben ist durch [6]

wobei &ohgr; = 2&pgr; f/fs und fs die Abtastfrequenz ist. Für positivere Werte von &lgr; wird die Auflösung bei niedrigen Frequenzen erhöht. Im Gegensatz dazu ergeben negative Werte von &lgr; eine höhere Auflösung bei hohen Frequenzen. Geeignete Werte von &lgr; können abhängig von der Anwendung gewählt werden. Zum Beispiel ist in [7] dargestellt, dass eine Näherung der Frequenzauflösung des menschlichen Gehörs erhalten wird, indem &lgr; = 0,723 gesetzt wird.

Eine verzerrte lineare prädiktive Kodierung kann mit Verfahren ausgeführt werden, welche standardisierten Verfahren ähnlich sind. Zum Beispiel können die Koeffizienten eines verzerrten Vorhersagefilters über die verzerrten normalen Autokorrelationsgleichungen geschätzt werden. Bei diesen Gleichungen wird die herkömmliche Autokorrelationsfunktion rk = E{yny*n-k} ersetzt durch r~k = E{&dgr;~0[yn]&dgr;~k[y*n]},(11) wobei E der Erwartungsoperator und &dgr;~k[.] ein verallgemeinerter Schiebeoperator ist, welcher definiert ist durch [4]

wobei dn die Impulsantwort des Allpassfilters ist. Das Gleichungssystem kann sogar effizient mittels des Levinson-Durbin-Algorithmus gelöst werden. Schließlich ist der Vorhersagefehlerfilter gegeben durch

Gemäß einer erfindungsgemäßen Ausführungsform wird das Eingangssignal Rahmen für Rahmen verarbeitet, wobei das frequenzverzerrte Burg's Verfahren eingesetzt wird. Das verzerrte Burg's Verfahren basiert auf einer Verzerrung des Allpassfilters. Dies wird durchgeführt, indem die Verzögerungselemente durch verzerrende Allpassfilter ersetzt werden. Um den verzerrten Vorhersagefehler in einer Stufe I zu berechnen, benötigen wir das allpassgefilterte Backward-Residuum b~(l)n = b(l-1)n-1 – &lgr;[b(l-1)nb~(l)n-1],(14) n = l, l + 1,...,N-1, wobei &lgr; der Verzerrungsfaktor ist. Da dies ein rekursives Filter ist, muss die Anfangsbedingung (d.h. der Wert von b~(l)l-1 ) gesetzt werden. Die offensichtlichste Wahl ist b~(l)l-1 = 0 .

Eine Verzerrung ändert auch die Allpassgleichungen von Gleichung (4) zu f(l)n = f(l-1)n + k~lb~(l-1)n-1b(l)n = b~(l-1)n-1 + k~lf(l-1)n(15) n = l, l + 1,..., N-1.

Die sich ergebende Gleichung für den Reflexionskoeffizienten ist

Man sieht aus Gl. (14), dass ein Parameterwert &lgr; = 0 den Algorithmus zu einem gewöhnlichen Burg's Verfahren reduziert.

Gemäß einer erfindungsgemäßen Ausführungsform wird das Eingangssignal Wert für Wert verarbeitet, wobei das frequenzverzerrte Burg's Verfahren eingesetzt wird. Wie vorab offenbart ist, wird eine AR-Modellierung gemäß einer erfindungsgemäßen Ausführungsform bewerkstelligt, wobei Rahmen für Rahmen verarbeitet wird. Eine Modellierung Rahmen für Rahmen führt eine Latenzzeit bei der Signalverarbeitung ein, welche bei einigen Lösungen nicht günstig ist. Wie bei jedem Rahmen für Rahmen arbeitenden Algorithmus muss ein vollständiger Rahmen für den Algorithmus verfügbar sein, bevor irgendeine Ausgabe erzeugt werden kann. Diese Latenzzeit macht eine AR-Modellierung mehr oder weniger unbrauchbar bei Echtzeitsignalverarbeitungslösungen, wie z. B. bei Klangeffekten, speziell, wenn lange Rahmenlängen erforderlich sind. Bei einer Verwendung z.B. des Verfahrens zur exponentiellen Gewichtung (EW) [8] wird die Latenzzeit bis auf die Ordnung des AR-Modells verringert.

Die Idee bei einem EW-Verfahren zur Aktualisierung der Modellparameter Wert für Wert ist, eine exponentielle Gewichtung im Zeitbereich einzusetzen, um die Erwartungswerte in Gleichung (16) zu berechnen. Dies kann erreicht werden durch

wobei &agr; ein Glättungsparameter ist. Je höher der Wert von &agr; ist, desto mehr Gewicht wird den vergangenen Werten gegeben und desto länger ist die Zeit, welche für das Modell benötigt wird, um sich an Änderungen bei der Quelle anzupassen.

Die Zeitkonstante der Anpassung ist

wobei &Dgr;t das Abtastintervall ist. Nun kann der Reflexionskoeffizient kl berechnet werden durch

Die vorliegenden Erfindungen werden nun im Folgenden vollständiger mit Bezug auf die beigefügten Zeichnungen beschrieben, in welchen einige, aber nicht alle, Ausführungsformen der Erfindung dargestellt sind. Allerdings können diese Erfindungen in vielen verschiedenen Formen ausgeführt werden und sollten nicht als auf die hier dargelegten Ausführungsformen beschränkt angesehen werden; sondern diese Ausführungsformen werden bereitgestellt, so dass diese Offenbarung maßgeblichen rechtlichen Auflagen genügt. Gleiche Bezugszeichen bezeichnen durchweg gleiche Elemente.

1 stellt ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer erfindungsgemäßen Ausführungsform dar. Die Figur stellt nur Elemente dar, welche zum Verständnis der vorliegenden Erfindung notwendig sind. Erfindungsgemäß wird bei der ersten Stufe, bei Block 10, dass Eingangsaudiosignal unter Verwendung einer AR-Modellierung modelliert, was bedeutet, dass die Modellkoeffizienten am in Gl. (1) aufgelöst werden. Der Benutzer kann den Modellierungsprozess über von dem Benutzer steuerbare Parameter steuern, welche die Modellordnung p in Gl. (1), den Verzerrungsfaktor &lgr; in Gl. (14) und die Anpassungskonstante &agr; in Gl. (17) umfassen. Indem diese Parameter verändert werden, kann der Benutzer die Klangeigenschaften des Ausgangssignals verändern. Diese Regler sind in 6 dargestellt. Bei der erfindungsgemäßen Ausführungsform gemäß 1 wird die AR-Modellierung im Block 10 durchgeführt, wobei ein solches Verfahren eingesetzt wird, wobei das Residuumsignal zeitgleich in dem Modellierungsprozess berechnet wird. Ein solches Verfahren kann z.B. das Burg's Verfahren sein. Das Residuumsignal wird in Block 30 zu dem Eingangssignal gemischt, typischerweise aufsummiert. Die Verarbeitung des Signals kann Rahmen für Rahmen basiert oder Wert für Wert basiert erfolgen und sie kann in Echtzeit erfolgen.

2 stellt ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer zweiten erfindungsgemäßen Ausführungsform dar. Die Figur stellt nur Elemente dar, welche zum Verständnis der vorliegenden Erfindung notwendig sind. In einigen Fällen ist es günstig oder notwendig, zuerst die AR-Parameter am in Gl. (1) zu berechnen und das Residuumsignal getrennt davon zu berechnen, wobei die AR-Parameter verwendet werden. Gemäß der erfindungsgemäßen Ausführungsform, welche in 2 dargestellt ist, wird bei der ersten Stufe, in Block 10, das Eingangsaudiosignal modelliert, indem eine AR-Modellierung verwendet wird, um die AR-Modellparameter zu erzeugen. Der Benutzer kann den Modellierungsprozess über von dem Benutzer steuerbare Parameter steuern, welche die Modellordnung p in Gl. (1), den Verzerrungsfaktor &lgr; in Gl. (14) und die Anpassungskonstante &agr; in Gl. (17) umfassen. Diese Regler sind in 6 dargestellt. Bei der zweiten Stufe wird das Residuumsignal des AR-Modells in einem getrennten Block 20 berechnet, was über ein inverses Filtern des Eingangsaudiosignals erreicht werden kann, wobei ein Filter verwendet wird, welches mit den AR-Parametern konstruiert ist, welche in dem ersten Schritt in Block 10' berechnet werden. Die Berechnung des Residuumsignals über eine inverse Filterung wird hier nicht im Detail beschrieben, da sie einem Fachmann allgemein bekannt ist. In der dritten Stufe, Block 30, werden das Eingangsaudiosignal und das Residuumsignal additiv zusammen gemischt, um das Ausgangsaudiosignal zu erzeugen. Die Verarbeitung des Signals kann Rahmen für Rahmen basiert oder Wert für Wert basiert erfolgen und sie kann in Echtzeit erfolgen.

3 stellt ein Blockdiagramm einer Signalverarbeitungseinheit gemäß einer erfindungsgemäßen Ausführungsform dar. Ein Signal, z.B. ein Audiosignal von einem Musikinstrument oder einer Stimme, wird in zwei, vorzugsweise gleiche, Signale geteilt, welche hier erstes und zweites Signal genannt werden. Das erste Signal wird durch einen Präprozessor geleitet, dessen Vorbearbeitung irgendeine Art einer Niveauanpassung, einer Filterung, einer dynamischen Verarbeitung oder einer Erzeugung eines Klangeffekts sein kann. Nach der Vorbearbeitung wird eine AR-Modellierung im Block 10' auf das sich ergebende Signal angewendet. Die AR-Modellparameter werden verwendet, um in Block 60 ein inverses Filter zu konstruieren. Das Ausgangssignal kann verändert werden, indem die von einem Benutzer steuerbaren Parameter verändert werden, welche den AR-Modellierungsprozess steuern. Diese Regler sind in 6 dargestellt. Das vorbearbeitete erste Signal wird im Block 60 durch den inversen Filter gefiltert, woraus sich das Residuumsignal ergibt. Die Verarbeitung der Blöcke 10' und 60 kann durch den Block 10, welcher in 1 eingesetzt wird, ersetzt werden, wo das Residuumsignal direkt bei dem AR-Modellierungsprozess berechnet wird. Eine Nachbearbeitung wird dann in Block 50 auf das Residuumsignal angewendet, welche irgendeine Art einer Niveauanpassung, einer Filterung, einer dynamischen Verarbeitung, einer Klangeffekterzeugung oder keine Bearbeitung sein kann. Das zweite Signal wird durch einen Präprozessor, Block 40, geleitet und das sich ergebende Signal wird additiv zu dem nachbearbeiteten Residuumsignal in Block 30 gemischt, so dass das nachbearbeitete Residuumsignal, welches von dem ersten Signal erhalten wird, und das vorbearbeitete zweite Signal im Zeitbereich synchronisiert werden. In der Mischstufe in Block 30 werden die gewichteten Versionen der zwei Signale zusammen addiert. Wie in 3 offenbart ist, ist es möglich, dass auch das Eingangssignal durch einen Präprozessorblock 40 geleitet wird. Darüber hinaus ist es, wie es in 3 offenbart ist, möglich, dass das gemischte Signal in Block 50 nachbearbeitet wird, um schließlich das Ausgangssignal zu erzeugen. Das Ausgangssignal kann mit anderen Signalprozessoren weiter bearbeitet werden und kann mit anderen Audiosignalen in einem Fall, bei welchem Musik gemischt wird, zusammen gemischt werden. Bei einer in einem Rack montierten Vorrichtung kann der Ausgang zu einer anderen Audioverarbeitungsvorrichtung, wie z.B. einer Mischkonsole, geroutet werden. Im Fall eines Gitarrenpedals kann das Ausgangssignal mit einem Gitarrenverstärker verbunden sein. Es ist auch möglich, dass keine Vorbearbeitung oder Nachbearbeitung bei einem oder mehreren Signalen, welche das Eingangssignal, das erste Signal, das zweite Signal, das Residuumsignal oder das Ausgangssignal umfassen, angewendet wird.

4 stellt ein Blockdiagramm einer Signalverarbeitungseinheit gemäß einer anderen erfindungsgemäßen Ausführungsform dar. Der Block 70 umfasst einen gesamten Prozess, welcher in 1, 2 oder 3 beschrieben ist. Bei dieser erfindungsgemäßen Ausführungsform sind zwei oder mehrere solcher verarbeitenden Elemente parallel verbunden, um das Ausgangssignal zu erzeugen. Wenn eine verzerrte AR-Modellierung verwendet wird, dann können die getrennten verarbeitenden Blöcke 70 auf verschiedene Frequenzbereiche gerichtet werden, indem verschiedene Werte für den Verzerrungsfaktor &lgr; in Gl. (14) gewählt werden.

5 stellt ein Blockdiagramm einer Signalverarbeitungsanordnung gemäß einer anderen erfindungsgemäßen Ausführungsform dar. Der Block 70 umfasst einen gesamten Prozess, welcher in 1, 2 oder 3 beschrieben ist. Bei dieser erfindungsgemäßen Ausführungsform sind zwei oder mehrere solcher verarbeitenden Elemente in Reihe verbunden, um das Ausgangssignal zu erzeugen.

Die Signalverarbeitung der vorliegenden Erfindung kann über mehrere Parameter gesteuert werden. Die Regler des Benutzers können zum Beispiel Regler für mindestens ein Element einer Gruppe umfassen, welche besteht aus dem Betrag des hinzugefügten Residuumsignals, einem Frequenzbereichsfokus, einer Modellordnung des AR-Modells, einer Niveausteuerung für das Eingangssignal und/oder das Ausgangssignal und einer Anpassungsgeschwindigkeit der AR-Modellierung. Diese Regler werden als ein Beispiel einer Ausführungsform einer Benutzerschnittstelle offenbart, welche in 6 dargestellt ist.

Die Benutzerschnittstelle, welche in 6 offenbart ist, stellt eine Benutzerschnittstellenanwendung dar, welche einem Benutzer z.B. über einen Computermonitor dargestellt werden kann. Die Regler 100600 werden durch erste Anweisungen bereitgestellt, um einem Benutzer eine oder mehrere Signalverarbeitungsoptionen darzustellen. Indem die dargestellten Regler eingestellt werden, kann der Benutzer die Qualität eines Ausgangssignals verändern.

Der Betrag des hinzugefügten Residuumsignals kann gesteuert werden, indem das Signal mit einem Gewichtsfaktor multipliziert wird, bevor das Residuum zu dem Eingangssignal oder dem vorbearbeiteten Eingangssignal addiert wird, indem ein Regler 100 eingestellt wird.

Die Verarbeitung kann auf einen erwünschten Frequenzbereich gerichtet werden, indem eine verzerrte AR-Modellierung verwendet wird, um das Residuumsignal zu erhalten. Der Benutzer kann dies steuern, indem der Wert des Verzerrungsfaktors &lgr; in Gl. (14) geändert wird, indem ein Regler 200 eingestellt wird.

Der Benutzer kann das Verarbeitungsergebnis verändern, indem die Modellordnung des AR-Modells, d.h. die Anzahl der Modellkoeffizienten p in den Gleichungen (1), (3) und (13), geändert wird, indem ein Regler 300 eingestellt wird.

Der Benutzer kann auch das Niveau des Eingangsaudiosignals verändern, indem ein Regler 400 eingestellt wird, und das Niveau des Ausgangsaudiosignals verändern, indem ein Regler 500 eingestellt wird.

Die Anpassungsgeschwindigkeit der AR-Modellierung kann durch den Benutzer über die Anpassungskonstante &agr; in Gleichung (17) gesteuert werden, indem ein Regler 600 eingestellt wird.

Es ist auch möglich, dass einer oder mehrere der Regler, welche in 6 offenbart sind, einem Benutzer in einer Form von Steuertasten, Steuerknöpfen oder Steuerregelvorrichtungen als ein Teil einer Signalverarbeitungsvorrichtung bereitgestellt werden. Zum Beispiel kann die Signalverarbeitungsvorrichtung ein Gitarrenpedal sein, welches Steuertasten oder Steuerknöpfe aufweist, um eine oder mehrere der erwähnten Regler zu steuern. Wenn die Signalverarbeitungsvorrichtung eine in einem Rack montierte Vorrichtung ist, kann die Vorrichtung in ähnlicher Weise erforderliche Regler umfassen.

In der Beschreibung angegebene Referenzen:

  • [1] M. J. L. de Hoon, T. H. J. J. van der Hagen, H. Schoonewelle, and H. van Dam, "Why Yule-Walker Should not be Used for Autoregressive Modelling," Annals of Nuclear Energy, Vol. 23, 1996.
  • [2] I. Kauppinen, J. Kauppinen, and P. Saarinen, "A Method for Long Extrapolation of Audio Signals," J. Audio Eng. Soc., Vol. 49, no. 12, Dec. 2001.
  • [3] J. P. Burg, "A New Analysis Technique for Time Series Data," NATO Advanced Study Institute on Signal Processing with Emphasis on Underwater Acoustics, Enschede, The Netherlands, Aug. 1968.
  • [4] A. Härmä, M. Karjalainen, V. Välimäki, L. Savioja, U. Laie, and J. Huopaniemi, "Frequency-Warped Signal Processing for Audio Applications," J. Audio Eng. Soc., Vol. 48, No. 11, Nov. 2000.
  • [5] G. Evangelista and S. Cavaliere, "Discrete Frequency Warped Wavelets: Theory and Applications," IEEE Trans. Signal Processing, Vol. 46, No. 4, Apr. 1998.
  • [6] H. W. Strube, "Linear Prediction on a Warped Frequency Scale," J. Acoust. Soc. Am., Vol. 68, No. 4, Oct. 1980.
  • [7] J. O. Smith and J. S. Abel, "Bark and ERB Bilinear Transforms," IEEE Trans. Speech Audio Processing, Vol. 7, No. 6, Nov. 1999.
  • [8] Kari Roth and Ismo Kauppinen, "Exponential Weighting Method for Sample-by-Sample Update of Warped AR-model," Proc. Int. Conf. on Digital Audio Effects (DAFx'04), Naples, Italy, Oct. 2004.


Anspruch[de]
Computerprogrammprodukt zur Signalverarbeitung, wobei das Computerprogrammprodukt ein von einem Computer lesbares Speichermedium mit von einem Computer lesbaren Programmanweisungen, welche in dem Medium enthalten sind, umfasst, wobei die von einem Computer lesbaren Programmanweisungen umfassen:

– erste Anweisungen, um eine auto-regressive (AR) Modellierung einzusetzen, um ein Residuumsignal von einem Eingangsaudiosignal zu erzeugen; und

– zweite Anweisungen, um das Residuumsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen.
Computerprogrammprodukt nach Anspruch 1, weiter dritte Anweisungen umfassend für mindestens eine Verarbeitung aus:

– eine Vorbearbeitung des Eingangsaudiosignals; und

– eine Nachbearbeitung des Ausgangsaudiosignals.
Prozessor zur Verarbeitung eines Signals, wobei der Prozessor mindestens umfasst:

– eine Verarbeitungseinheit, um von einem Eingangsaudiosignal ein Residuumsignal zu erzeugen, wobei eine auto-regressive (AR) Modellierung eingesetzt wird; und

– eine Mischeinheit, um das Residuumsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen.
Signalverarbeitungsvorrichtung, wobei die Vorrichtung mindestens umfasst:

– eine Empfangseinheit, welche derart ausgestaltet ist, dass sie ein Eingangsaudiosignal empfängt;

– eine Verarbeitungseinheit, um ein Residuumsignal von dem Eingangsaudiosignal zu erzeugen, wobei eine auto-regressive (AR) Modellierung eingesetzt wird;

– eine Mischeinheit, um das Residuumsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen; und

– eine Ausgangseinheit, welche derart ausgestaltet ist, dass sie eine Ausgabe für das Ausgangsaudiosignal bereitstellt.
Vorrichtung nach Anspruch 4, wobei die Vorrichtung weiter eine Steuereinheit in Verbindung mit der Verarbeitungseinheit umfasst, wobei die Steuereinheit einer Bedienperson eine Steuerung von einer oder mehreren Variablen bereitstellt, welche bei der AR-Modellierung eingesetzt werden. Vorrichtung nach Anspruch 5, wobei die Vorrichtung ein Gitarrenpedal ist. System zur Signalverarbeitung, wobei das System mindestens umfasst:

– eine Spannungszufuhr;

– einen digitalen Eingang und/oder einen analogen Eingang;

– einen Prozessor, welcher mindestens eine Verarbeitungseinheit, um von einem Eingangsaudiosignal ein Residuumsignal zu erzeugen, wobei eine autoregressive (AR) Modellierung eingesetzt wird, und eine Mischeinheit, um das Residuumsignal dem Eingangsaudiosignal hinzuzufügen, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen, umfasst;

– mindestens eine Steuerung, um Variablen der AR-Modellierung, welche bei der Erzeugung des Residuumsignals verwendet werden, zu beeinflussen; und

– einen digitalen Ausgang und/oder einen analogen Ausgang.
Benutzerschnittstellenanwendung für eine Verarbeitungseinheit, um ein Residuumsignal von einem Eingangsaudiosignal zu erzeugen, wobei eine autoregressive (AR) Modellierung eingesetzt wird, wobei die Benutzerschnittstellenanwendung umfasst:

– erste Anweisungen, um einer Bedienperson eine oder mehrere Audiosignalverarbeitungsoptionen darzustellen; und

– zweite Anweisungen, um Variablen der AR-Modellierung, welche bei einer Erzeugung der Residuumeingaben verwendet werden, basierend auf Benutzereingaben bezüglich der dargestellten Audiosignalverarbeitungsoptionen zu beeinflussen.
Verfahren zur Verarbeitung eines Signals, wobei das Verfahren mindestens folgende Schritte umfasst:

– Verwenden einer auto-regressiven (AR) Modellierung, um ein Residuumsignal von einem Eingangsaudiosignal zu erzeugen; und

– Hinzufügen des Residuumsignals zu dem Eingangsaudiosignal, um ein verarbeitetes Ausgangsaudiosignal zu erzeugen.
Verfahren nach Anspruch 9, wobei die AR-Parameter, welche bei der AR-Modellierung verwendet werden, unter Verwendung des Burg's Algorithmus berechnet werden. Verfahren nach Anspruch 9, wobei eine Frequenzverzerrung bei der AR-Modellierung eingesetzt wird. Verfahren nach Anspruch 9, wobei das Eingangsaudiosignal Rahmen für Rahmen unter Verwendung des frequenzverzerrten Burg's Verfahrens verarbeitet wird. Verfahren nach Anspruch 9, wobei das Eingangsaudiosignal Wert für Wert unter Verwendung des frequenzverzerrten Burg's Verfahrens verarbeitet wird. Verfahren nach Anspruch 9, wobei das Eingangsaudiosignal und/oder das Ausgangsaudiosignal ein von Menschen hörbares Signal ist. Verfahren nach Anspruch 9, wobei das Eingangsaudiosignal und/oder das Ausgangsaudiosignal ein Signal in dem Frequenzbereich von 0–20.000 Hz ist. Verfahren nach Anspruch 9, wobei das Eingangsaudiosignal und/oder das Ausgangsaudiosignal ein Signal in dem Frequenzbereich von 20–20.000 Hz ist. Verfahren nach Anspruch 9, wobei das Eingangsaudiosignal eine menschliche Stimme oder ein Klang eines Musikinstruments ist.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com