PatentDe  


Dokumentenidentifikation DE69429917T2 18.07.2002
EP-Veröffentlichungsnummer 0699334
Titel VERFAHREN UND VORRICHTUNG ZUR GRUPPENKODIERUNG VON SIGNALEN
Anmelder Motorola, Inc., Schaumburg, Ill., US
Erfinder STEWART, A., Kenneth, Chicago, US;
KOTZIN, D., Michael, Buffalo Grove, US
Vertreter SCHUMACHER & WILLSAU, Patentanwaltssozietät, 80335 München
DE-Aktenzeichen 69429917
Vertragsstaaten DE, GB, SE
Sprache des Dokument EN
EP-Anmeldetag 22.12.1994
EP-Aktenzeichen 959072414
WO-Anmeldetag 22.12.1994
PCT-Aktenzeichen PCT/US94/14775
WO-Veröffentlichungsnummer 0009522818
WO-Veröffentlichungsdatum 24.08.1995
EP-Offenlegungsdatum 06.03.1996
EP date of grant 20.02.2002
Veröffentlichungstag im Patentblatt 18.07.2002
IPC-Hauptklasse G10L 19/00
IPC-Nebenklasse H04J 3/16   

Beschreibung[de]

Die vorliegende Erfindung betrifft Kommunikationssysteme, die CDMA-Verfahren (CDMA = Code Division Multiple Access / Mehrfachzugriff im Codemultiplex) und spezieller Sprachkodierverfahren mit variabler Rate zur Verringerung der System-Selbst-Interferenz und zur Verbesserung der Systemkapazität bei punkt-multipunkt Mehrfachzugriffverbindungen mit nicht abgesetzter beziehungsweise nebengeordneter digitaler Sprachkodierung in derartigen Kommunikationssystemen.

In den zurückliegenden Jahren wurde eine Vielfalt von Techniken verwendet, um Multi-Benutzer Mobilkommunikationen innerhalb eines beschränkten verfügbaren Hochfrequenzspektrums vorzusehen. Diese Verfahren haben FDMA (FDMA = Frequency Division Multiple Access / Frequenzmultiplexverfahren), TDMA (TDMA = Time Division Multiple Access / Mehrfachzugriff im Zeitmultiplex) und CDMA (CDMA = Code Division Multiple Access / Mehrfachzugriff im Codemultiplex) oder, häufiger, Mischformen von diesen Verfahren umfasst. Alle diese Verfahren wurden innerhalb der letzten Dekade beim Entwurf von kommerziellen zellularen Telekommunikationssystemen eingesetzt: nachweislich die Verwendung von FDMA im Nordamerikanischen AMPS- System, FD/TDMA im Europäischen GSM-Standard (GSM = Groupe Speciale Mobile / globales System für mobile Kommunikation) und - seit kurzem - die Anwendung eines Direktsequenz-FD/CDMA-Verfahrens durch die United States Telecommunications Industry Association, wie es in ihrem IS-95-Standard angegeben ist. In dem IS-95-Standard teilen sich Benutzer einen von mehreren Breitband- Funkkanälen in dem zellularen Band. Verschiedene Vorschläge für sogenannte PCS (PCS = Personal Communications Systems / persönliche Kommunikationssysteme) werden ebenfalls entsprechend ähnlichen FD/CDMA-Prinzipien entworfen.

Fast alle bisherigen Zellular- und PCS-Systeme haben die digitale Sprachkodierung und die Weiterleitung einer Vorwärts-Kanalfehlerkorrektur als physikalische Schicht für die Sprachkommunikation verwendet. In diesem Zusammenhang interessanter ist die Verwendung von VAD (VAD = Voice Activity Detection / Erkennung der Stimmaktivität), um das Vorhandensein oder das Fehlen von Sprache auf der jeweiligen Seite der Gesprächsteilnehmer zu erkennen. Beim Fehlen von Sprache kann der Sprachkodierer den Modulator oder den Sender, mit dem er verbunden ist, anweisen, seine Ausgangsleistung auf Null zu verringern oder gelegentlich Pakete von Informationen zu übertragen, die nur das Hintergrundrauschen an der jeweiligen Position des Benutzers beschreiben. Die Verringerung des Betriebszyklus beziehungsweise der Einschaltzeit des Funksenders auf diese Weise ergibt die beiden Vorteile einer Verringerung des Energieverbrauchs (was die Batterielebenszeit im Falle der mobilen Einheit verlängert) und einer Verringerung der Interferenz zwischen Benutzern, die sich das gleiche RF- beziehungsweise HF- beziehungsweise Hochfrequenz-Spektrum teilen. In Abhängigkeit von den Umständen des Gesprächs kann eine Verringerung der gesendeten Leistung zwischen 40% und 65% erreicht werden. Die Höhe der Leistungsverringerung ist ultimativ auf das Ausmaß beschränkt, bis zu dem eine verschlechterte Sprachqualität, die VAD-Verfahren deutlich begleitet, als akzeptabel betrachtet wird.

Die Möglichkeit der Leistungsverringerung ist insbesondere für CDMA-Systeme wichtig. In derartigen Systemen ist die Benutzerkapazität umgekehrt proportional zur Höhe der System-Selbst-Interferenz. Im TIA IS-95 FD/CDMA-Standard werden die Möglichkeiten leicht verbessert, indem ein Sprachkodierer mit variabler Rate anstelle von einfachen Ein-Aus-Verfahren oder Verfahren mit diskontinuierlicher Übertragung verwendet wird. Bei dem IS-95-Standard wird die kodierte Sprache in Intervalle von 20 ms unterteilt, die der Sprachkodierer auswählen kann, um bei einer effektiven Bitrate von 8000 bps, 4000 bps, 2000 bps oder 800 bps zu kodieren. Sowohl die IS-95-Verbindungen von der Basisstation zur Mobilstation (vorwärts) als auch von der Mobilstation zur Basisstation (rückwärts) nutzen die Kodierung mit variabler Rate. Im Falle der Vorwärtsverbindung wird die mittlere Sendeleistung verringert, indem die Ausgangsleistung heruntergefahren wird, wenn die Kodierrate abnimmt. Die Kanal-Symbol-Wiederholung ermöglicht die Symbolkombination beim mobilen Empfänger und somit das Aufrechterhalten des Verhältnisses der Energie pro Symbol zur Rauschleistungsspektraldichte, das die Verbindungsleistung bestimmt. Es ist zu beachten, dass die mittlere Sendeleistung - und somit die System-Selbst-Interferenz - bei einer Übertragung mit 800 bps um einen Faktor von vier verringert wird. Durch Mittlung der Menge beziehungsweise Summe der Sprachaktivität von typischen Zweiweggesprächen wurde abgeschätzt, dass, wenn die in den TIA-Standard IS-96 definierten Algorithmen für die Standard-Sprachkodierung und die Sprachaktivitätserkennung verwendet werden, die mittlere Sendeleistung auf ungefähr 41% ihres normalen Wertes abfällt. Dies hat eine deutliche Auswirkung auf die System-Vorwärtsverbindungskapazität.

Bei derzeitigen Anwendungen des IS-95- Luftschnittstellenstandards und des diesem zugeordneten IS-96-Sprachkodiererstandards wird jedoch jede Vorwärtssprachverbindung isoliert kodiert. Das heißt, Sprachkodierer treffen individuelle Feststellungen von der minimalen Kodierrate, die zur Aufrechterhaltung einer akzeptablen Sprachqualität erforderlich ist, ohne die anderen Sprachkanäle zu berücksichtigen, die das gleiche HF- Spektrum teilen. Dies erfordert, dass der Raten- Bestimmungsalgorithmus in jedem Sprachkodierer seine Kodierrate immer minimieren sollte, auch wenn die Kodierraten der anderen Sprachkodierer, die das gleiche Spektrum teilen, dies nicht erfordern. Beispielsweise wenn alle Sprachkodierer, die den gleichen Kanal einer Basisstation teilen, gleichzeitig versuchen sollten mit einer niedrigen Rate zu senden, bedeutet die Verringerung der Gesamtausgangsleistung an der Basisstation, dass jeder Sprachkodierer ohne Risiko für die Systemkapazität zu der nächst höheren Rate wechseln könnte. Weil die Minimierung der mittleren Senderate für einen Sprachkodierer mit variabler Rate erfordert, dass bezüglich der Sprachqualität ein Kompromiss eingegangen wird, verzichtet die isolierte Sprachkodierung grundlos auf Sprachqualität. Wenn sich das CDMA-System der Kapazität nähert und der übertragungsrate von jedem Sprachkodierer Einschränkungen auferlegt werden, um temporär die Kapazität zu steigern, müssen derartige Einschränkungen weiterhin blind angewendet werden, wobei alle Sprachverbindungen der gleichen Einschränkung unterworfen werden, unabhängig von der Auswirkung auf die Sprachqualität. Dies stellt eine Verschwendung dar, weil es bekannt ist, dass die Sprachqualität von vielen unterschiedlichen Faktoren abhängt, und somit bestehen Möglichkeiten, die Rate von bestimmten Kodierern zu verringern, mit der kleinsten Gesamtauswirkung auf die Sprachqualität, die innerhalb des Sektors beziehungsweise der Zelle vorliegt.

Somit besteht eine Notwendigkeit für ein Verfahren und eine Vorrichtung für die globale Sprachkodierung auf der Vorwärtsverbindung eines FD/CDMA-Systems, in dem Ratenauswahlentscheidungen für einzelne Sprachkodierer getroffen werden, in Übereinstimmung mit allen anderen Sprachkodierern, die den gleichen Sektor beziehungsweise die gleiche Zelle und den gleichen HF-Kanal ansteuern.

Die EP 327101 beschreibt ein Satellitenkommunikationssystem mit einer variablen Kanalkodierrate, bei dem alle Kanäle verbunden bleiben, ohne dass irgend ein Anstieg zusätzliche Frequenzbänder erfordert. Das System verändert selektiv die Kanalkodierrate von Daten, um die Übertragung von massiven beziehungsweise umfangreichen Daten zu implementieren, ohne dass eine Vergrößerung des Frequenzbandes bei einem Satellitentransponder erforderlich ist. Die vergrößerte Bitfehlerrate, die durch die verringerte Kanalkodierung verursacht wird, wird durch einen vergleichbaren Anstieg der Sendeleistung kompensiert.

Gemäß einem ersten Grundgedanken der vorliegenden Erfindung wird ein Verfahren zur Gruppenkodierung von Signalen gemäß Anspruch 1 vorgesehen.

Gemäß einem zweiten Grundgedanken der vorliegenden Erfindung wird eine Vorrichtung zur Gruppenkodierung von Signalen gemäß Anspruch 3 vorgesehen.

Fig. 1 zeigt allgemein, in Blockschaltbildform, einen CDMA-Basisstationsender gemäß dem Stand der Technik.

Fig. 2 zeigt allgemein, in Blockschaltbildform, die Ratenbestimmungsvorrichtung gemäß dem Stand der Technik, die in dem Sprachkodierstandard TIA IS-96- Standard spezifiziert ist.

Fig. 3 zeigt allgemein, in Blockschaltbildform, einen linearen Prediktionssprachkodierer mit Codebuch- Erregung von dem Typ, der bei einer bevorzugten Ausführungsform verwendet wird und der detailliert in dem Sprachkodierstandard TIA IS-96 beschrieben ist.

Fig. 4 zeigt allgemein, in Blockschaltbildform, die Verwendung eines Überwachungsprozessors oder -ratencontrollers, um die Sprachkodierung gemäß der Erfindung zu gruppieren.

Fig. 5 zeigt allgemein eine Raten/Qualitäts- Tabelle, die von dem Ratencontroller als Teil einer Anzahl von Algorithmen zur Optimierung der Gesamtsprachqualität eines Sektors beziehungsweise einer Zelle verwendet wird, der eine Einschränkung der Sendeleistung von dem Sektor beziehungsweise der Zelle gemäß der Erfindung auferlegt ist.

Fig. 6 zeigt allgemein, in Blockschaltbildform, eine Vorrichtung zur Implementierung des CDMA- Gruppenkodierverfahrens gemäß der Erfindung.

Fig. 7 zeigt allgemein, in Blockschaltbildform, einen Ratencontroller, der die Gruppenkodierung gemäß der vorliegenden Erfindung in vorteilhafter Weise implementieren kann.

Ein CDMA-Kommunikationssystem (CDMA = Code Division Multiple Access / Mehrfachzugriff im Codemultiplex) verringert die System-Selbst-Interferenz und verbessert die Systemkapazität, indem es Ratenauswahlentscheidungen für einzelne Sprachkodierer in Übereinstimmung mit anderen Sprachkodierern trifft. Das System verwendet empfindungsgemäß gewichtete Fehlermetriken (401) als Eingabe in einen Ratencontroller (404), der ausgewählte Raten (402) bestimmt und zurück zu dem Kodierer (105) führt. Das System ergibt eine optimale Sprachqualität und Systemkapazität, indem es bestimmten Kodierern erlaubt, ihre Rate wie erforderlich zu senken, was die Kapazität verbessert, während es anderen Kodierern erlaubt, ihre Raten aufrecht zu halten. Dies verhindert eine unnötige Verschlechterung der Sprachqualität zu den Zeitpunkten, zu denen die Systemkapazität temporär vergrößert werden muss.

Die bevorzugte Ausführungsform der Erfindung wird bezüglich einem CDMA-Digitalzellularkommunikationssystem beschrieben, das auf den Standards der Telecommunications Industry Association IS-95 und IS-96 basiert. Dem Fachmann ist klar, dass die Erfindung auf jede CDMA- punkt-zu-multipunkt-Verbindung (allgemein die Vorwärtsverbindung eines digitalen zellularen Systems) angewendet werden kann, bei der eine Selbst-Interferenz- Verringerung durch Sprachkodierung mit variabler Rate anzuwenden ist. Die diskutierte Technik kann jedoch in vorteilhafter Weise in jedem Kommunikationssystem angewendet werden und ist tatsächlich nicht auf Kommunikationssysteme beschränkt. Beispielsweise kann die Technik verwendet werden, wenn eine Sprachkodierung zur Speicherung in Speichermitteln verwendet wird, die einen begrenzten Speicherplatz aufweisen. Der Kern der Technik ist auf jede Anwendung anwendbar, bei der eine Kodierung (sei es Sprache, Video, Daten, etc.) verwendet wird und bei der Einschränkungen hinsichtlich der Kodierung (sei es der Leistungspegel, die Kodierqualität, die Systemkapazität, der Speicherplatz, etc.) vorliegen.

Das Verfahren und die Vorrichtung führen eine Gruppenkodierung von Signalen durch, indem Ratenbestimmungsinformationen von zumindest zwei Kodierern entgegengenommen werden und die Rate von zumindest einem Kodierer auf der Grundlage der Ratenbestimmungsinformationen für die zumindest zwei Kodierer bestimmt wird. Bei der bevorzugten Ausführungsform sind die Ratenbestimmungsinformationen Qualitätsinformationen, die die Rekonstruktionsqualität als eine Funktion der Kodierrate (auf einer 20 ms Segment für 20 ms Segment Grundlage) betreffen. Die Qualitätsinformationen umfassen, ohne darauf beschränkt zu sein, empfindungsgemäß wichtende Fehlermetriken, die durch die Analyse-durch-Synthese- Sprachkodierer, das S/N-Verhältnis (S/N = Signal-to- Noise / Signal-Rausch-Abstand), den segmentierten S/N, den Cepstral-Abstand, eine LPC-Abstandsmessung und eine BARK-Spektralabstandsmessung erzeugt werden, von denen alle hinreichend bekannt sind.

Die Bestimmung der Rate des zumindest einen Kodierers basiert auf einem Schwellenwertkriterium (das typischerweise vorgegeben ist). Bei der bevorzugten Ausführungsform kann das Schwellenwertkriterium, ohne darauf beschränkt zu sein, die Gesamtausgangsleistung des Sektors beziehungsweise der Zelle, der die Kodierer zugeordnet sind, die Gesamtausgangsleistung eines benachbarten Sektors beziehungsweise einer benachbarten Zelle, der aktuelle Leistungspegel einer Übertragung durch eine dienstleistende Basisstation, die aktuelle Datenrate der zumindest zwei Kodierer, der in Speichermitteln verfügbare Speicher, die in Bearbeitungs- beziehungsweise Berechnungsmitteln verfügbare Bearbeitungs- beziehungsweise Rechenleistung und die Bandbreite, die in einem vorherbestimmten Spektrum zur Verfügung steht, umfassen. Bei der bevorzugten Ausführungsform sind die Kodierer weiterhin Analyse-durch-Synthese-Kodierer mit variabler Rate. Diese Kodierer können Signale kodieren, die, ohne darauf beschränkt zu sein, Sprachsignale, Videosignale und Datensignale umfassen können.

Fig. 1 zeigt die High-Level-Architektur der Vorwärtsverbindung einer CDMA-Basisstation (102), die für die bevorzugte Ausführungsform des TIA IS-95 digitalen zellularen Funkstandards ausgelegt ist. Die Basisstation (102) von Fig. 1 führt, unter anderem, eine Sprachkodierung mit variabler Rate, eine Vorwärts- Fehlerkorrektur, eine Vorwärts-Verbindungsleistungssteuerung, eine Mehrfachzugriffspreizung und eine Modulation und Übertragung durch. In Fig. 1 werden mehrere Standard-u-Gesetz-kodierte, gemultiplexte, 64 kbps PCM- T1-Verbindungen (101) (PCM = Pulse Code Modulated / Pulscode moduliert) von dem PSTN (PSTN = Public Switched Telephone Network / öffentliches Fernsprechnetz) (100) einem Demultiplexer (103) zugeführt. Jede 64 kbps Sprachverbindung (104) wird dann durch einen digitalen Sprachkodierer (105) geführt. Bei einer herkömmlichen Implementierung wird die Sprachkodierungsfunktion von einer Anzahl von DSPs (DSP = Digital Signal Processor / digitaler Signalprozessor) für allgemeine Zwecke durchgeführt, wie beispielsweise dem Prozessor DSP56156 von Motorola, ROM-kodierten DSPs oder von ASICs (ASIC = Application Specific Integrated Circuit / anwendungsspezifische integrierte Schaltung). Mehrere derartiger Prozessoren sind im Allgemeinen auf einer einzigen Leiterplatte angeordnet (obwohl dies für die Erfindung nicht wesentlich ist), die dann dazu in der Lage ist, einen vollständigen T1-Trunk (Trunk / hochkapazitive Verbindung) von gemultiplexten Sprachkanälen zu bearbeiten. Nach der Sprachkodierung wird eine Fehlerkorrektur (106) in Form von konvolutionellen und zyklischen Codes angewendet, gefolgt von einer BPSK-Basisbandmodulation (107), einer Walsh-Cover- und einer kurzen PN- Sequenzspreizung (108) (PN = Pseudo-Noise / Pseudorauschen), einer Tiefpassfilterung (109), einer Sendeleistungspegeleinstellung (110) und einer Leistungsverstärkung (111), und schließlich der Übertragung zu der Mobilstation (113) (der Einfachheit halber ist die Frequenzverschiebung zu HF nicht dargestellt).

Ein Blockschaltbild der TIA-IS-96- Standardbearbeitung, die durch den DSP oder eine andere Vorrichtung zur Implementierung des Sprachkodierers (105) verwendet wird, ist in Fig. 2 gezeigt. Wie dargestellt, kann der Sprachkodierer (105) in die zwei Hauptelemente Ratenbestimmung und Kodierung aufgeteilt werden. Zunächst wird die Ratenbestimmungsfunktion betrachtet. Beim IS-96-Standard unterteilt jeder Sprachkodierer (105) seinen zugeordneten PCM-Signalstrom in zusammenhängende 20 ms Rahmen, die aus 160 Abtastungen der Quell-Sprachwellenform bestehen. Der Leistungspegel für jeden Frame beziehungsweise Rahmen (der die nullte Verzögerung R(0) der Autokorrelationsfunktionsabschätzung des Rahmens ist, die durch den Autokorrelationsschätzer (200) erzeugt wird) wird einer Bank von Vergleichern (203) zugeführt, die feststellen, welchen von drei monoton steigenden Schwellenwertpegeln die Rahmenleistung übersteigt. Diese Pegel werden durch eine Interpolation zweiter Ordnung eines nicht linearen Mittelwertes des Leistungspegels des Sprachsignals erzeugt, die durch den Block (201) gebildet ist. Es ist zu beachten, dass alle diese Bearbeitungsschritte vollständig in dem TIA- Standard IS-96 definiert sind. Wenn die aktuelle Rahmenenergie kleiner als der niedrigste der drei Schwellenwerte ist, wird der Rahmen zu einem 1/8-Ratenrahmen deklariert; wenn die Rahmenenergie zwischen dem niedrigsten und dem mittleren der Schwellenwerte liegt, wird der Rahmen als ein 1/4-Ratenrahmen deklariert; wenn sie zwischen dem mittleren und dem höchsten Schwellenwert liegt, wird ein 1/2-Ratenrahmen deklariert; und schließlich, wenn die Rahmenenergie den höchsten Schwellenwertpegel übersteigt, wird der Rahmen als ein Vollratenrahmen deklariert. Dieser letzte Schritt wird durch die Vergleicher (203) und den Dekodierer (204) durchgeführt, um die ausgewählte Rate (205) zu produzieren.

Die ausgewählte Rate (205) wird dann der CELP- Sprachkodierfunktion (206) (CELP = Codebook Excited Linear Predictive / lineare Prediktion mit Codebuch- Erregung) zugeführt, die eine parametrische Beschreibung des Sprachrahmens bildet, unter Verwendung der spezifizierten Anzahl von Bits für diese Rate. Bei der bevorzugten Ausführungsform ist die Anzahl von Bits, die verwendet wird, um die kodierten Parameter für einen 1/8- Ratenrahmen auszudrücken, 16 (wobei zusätzliche Bits ignoriert werden, die zur Fehlerkorrektur/-detektion verwendet werden); für einen 1/4-Ratenrahmen 40 Bits; für einen 1/2-Ratenrahmen 72 Bits; und für einen Vollratenrahmen 160 Bits. Obwohl CELP bei der bevorzugten Ausführungsform dargestellt und beschrieben ist, können andere Kodiertechniken wie, unter anderem, die Wellenformkodierung, die LPC (LPC = Linear Predictive Coding / lineare Prediktionskodierung), die SBC (SBC = Sub-Band Coding / Teilbandkodierung), CELP (CELP = Code Excited Linear Prediction / lineare Prediktionskodierung mit Code-Erregung), VSELP (SELP = Stochastically Excited Linear Prediction / lineare Prediktionskodierung mit stochastischer Erregung), VSELP (VSELP = Vector Sum Excited Linear Prediction / lineare Prediktionskodierung mit Vektorsummen-Erregung), IMBE (IMBE = Improved Multiband Excitation / verbesserte Multiband-Erregung) und ADPCM (ADPCM = Adaptive Differential Pulse Code Modulation / adaptive Differentialpulscodemodulation), in ähnlicher Weise vorteilhaft verwendet werden.

Zum Zwecke der Klarheit ist es erforderlich, die CELP-Sprachkodierprozedur ausführlicher zu beschreiben. Ein High-Level-Blockdiagramm der bei dem CELP- Sprachkodierer der bevorzugten Ausführungsform verwendeten Signalbearbeitung ist in Fig. 3 dargestellt. Wie dies in Fig. 3 dargestellt ist, wird eine Schätzung (309) der Autokorrelationsfunktion von aufeinanderfolgenden 20 ms Rahmen des 64 kbps Sprachsignals (104) zuerst erhalten (dies erfolgt gewöhnlich gemeinsam mit dem Block (200) der Ratenbestimmungsprozedur). Als nächstes ergibt die Lösung der sogenannten Normalgleichungen unter Verwendung, beispielsweise, der Schur-Recursion (301) die STP-Filterkoeffizienten (310) (STP = Short Term Linear Predictive / lineare Kurzzeitprediktion). Häufig ist das STP-Filter (303) ein Brückenfilter und die STP-Koeffizienten sind Brückenfilterreflektionskoeffizienten. Nach einer Quantisierung (302) durch Linenspektrumpaarung oder ein anderes robustes Quantisierungsverfahren werden die STP-Koeffizienten zur Filterung des Sprachsignals verwendet. Das erhaltene Signal wird als nächstes dem LTP-Filter (313) (LTP = Long Term Prediction / Langzeitprediktion) zugeführt und (im Falle eines CELP-Linearprediktionskodierers) der Codebuch- Suchprozedur. Das LTP-Filter ist im Allgemeinen ein rekursives Filter erster Ordnung, dessen Rückführverzögerung und Verstärkung variabel sind - sie tauchen in Fig. 3 als LTP-Verzögerung L (304) und LTP-Verstärkung G (305) auf. Die Kodierung schreitet dann fort, indem gleichzeitig die LTP-Verzögerung und -Verstärkung und der Codebuch-Index I (312) so eingestellt werden, dass der quadratische Fehler am Ausgang des LTP-Filters minimiert wird. L, G und I werden dann quantisiert (häufig unter Verwendung von einfachen kodierten linearen Quantisierungsverfahren) und gemeinsam mit den STP- Koeffizienten dem Fehlerkorrekturblock zugeführt. Die Leistung von dieser Analyse-durch-Synthese-Prozedur kann verbessert werden, indem die Fehlermetrik gewichtet wird, die durch den Frequenzgang des menschlichen Gehörs zu minimieren ist. Dies erfolgt mit einem empfindungsgemäß wichtenden Filter (307), der die Fehlermetrik (308) modifiziert, um diejenigen Frequenzkomponenten zu betonen, für die das menschliche Ohr am empfindlichsten ist.

Dem Fachmann ist klar, dass die empfindungsgemäß gewichtete Fehlermetrik von fast allen anspruchsvollen Analyse-durch-Synthese-Sprachkodierern zur Verfügung gestellt wird. Die vorliegenden Erfindung, wie vorstehend erwähnt, ist daher nicht exklusiv auf CELP-Sprachkodierer beschränkt.

Mit diesem Hintergrund kann nun die Gruppensprachkodierung gemäß der Erfindung beschrieben werden. Aus Fig. 1 und Fig. 2 ist klar, dass beim Stand der Technik die Kodierrate von jedem Vorwärtverbindung- Sprachkodierer isoliert bestimmt wird. Das heißt, die kodierte Rate von jeder 64 kbps Sprachverbindung wird exklusiv bestimmt, durch Signalverarbeitung von diesem Sprachsignal. Weil die Höhe der Selbst-Interferenz (und somit der Kapazität) in der Vorwärtsverbindung eines CDMA-Systems von der mittleren Kodierrate von jedem Kodierer abhängt ist auch klar, dass zum Betrieb mit der maximal möglichen Kapazität der Ratenbestimmungsalgorithmus von jedem Sprachkodierer derart ausgelegt sein muss, dass er immer die minimal mögliche Rate sucht, weil jeder Kodierer isoliert arbeitet und keine Kenntnis von der Gesamtleistung (und daher der System-Selbst- Interferenz) hat, die von der Basisstationantenne (112) ausgesendet wird. Weil Sprachqualität geopfert werden muss, um niedrige mittlere kodierte Raten zu erzielen bedeutet dies, dass Gesamtsystemsprachqualität unnötigerweise geopfert wird, wenn das System sich nicht bei seiner maximalen Kapazität befindet - oder, gleichbedeutend, nicht seine maximal abgebbare Leistung aussendet. Anders ausgedrückt erlaubt die isolierte Sprachkodierung, dass die momentane Gesamtausgangsleistung an der Basisstation eine große Varianz beziehungsweise Abweichung aufweist.

Weil bei vielen CDMA-Leistungssteuerungsalgorithmen eine strickte Grenze für die von einer Zelle oder einem Sektor ausgesendete Gesamtleistung vorgesehen ist, muss die zur Kodierung von einzelnen Verbindungen verwendete Rate unnötigerweise niedrig gehalten werden. Weiterhin ist es bekannt, dass die empfindungsgemäße Qualität einer digital kodierten Sprachverbindung nicht nur von dem verwendeten Sprachkodierer abhängt, sondern auch von Faktoren wie dem Geschlecht, dem Akzent, der Lautstärke des Sprechers und Umgebungsfaktoren, wie beispielsweise dem Typ/Pegeln von akustischen Hintergrundrauschen. Durch die isolierte Kodierung von jeder Verbindung erfolgt somit keine Erkennung von Situationen, in denen eine Verbindung bezüglich der Rate mit einem geringeren Verlust an empfindungsgemäßer Gesamtsprachqualität verringert werden kann als eine äquivalente Verringerung der Rate einer anderen Verbindung, und somit eines anderen Sprechers. Weiterhin verwendet die derzeit beim TTA- Standard-IS-96 eingesetzte Technik keinen empfindungsgemäß gewichteten Kodierfehler bei der Durchführung der Ratenbestimmung.

Das in Fig. 4 gezeigte Verfahren kann dazu verwendet werden, diese Nachteile zu beheben. In Fig. 4 ermittelt jeder Sprachkodierer (105), für jeden 20 ms Rahmen, die empfindungsgemäß gewichtete Fehlermetrik (401), die durch die Kodierung des Sprachrahmens bei jeder der Fehlerratenkandidaten erzeugt wird (bei anderen Ausführungsformen können mehr als vier Raten möglich sein). Diese Informationen werden dann zu einem Ratenüberwachungscontroller (404) zurückgeführt. Der Ratencontroller (404) bildet dann eine Raten-/Qualitättabelle ähnlich der von Fig. 5, die die empfindungsgemäß gewichteten Fehler darstellt, die durch die Kodierung bei jedem der Ratenkandidaten für jeden der N Sprachkodierer erzeugt wird, die dem Ratencontroller berichten.

Eine einfache Möglichkeit zur Optimierung der Gesamtsprachqualität der Zelle oder des Sektors beginnt mit der Annahme, dass alle N Sprachkanäle die gleiche Sendeleistung aufweisen. Alle der Kodierer (105) werden in dem niedrigsten Ratenkandidat angeordnet und die gesendete Gesamtleistung P wird durch den Ratencontroller (404) berechnet. In diesem Fall ist P einfach gleich der Summe der Ratenwerte für alle N Kodierer, wobei der Ratenwert für eine 1/8-Rate 1/8 beträgt, für eine 1/4-Rate 1/4 und so weiter. Der Ratencontroller (404) findet dann den größten Eintrag in der Raten-/Qualitättabelle entsprechend dem aktuellen Ratenkandidat für jeden der N Kodierer. Dies ist äquivalent zur Identifizierung des Kodierers mit der schlechtesten Sprachqualität (das heißt dem größten empfindungsgemäß gewichteten Fehler) für die aktuelle Gruppe von ausgewählten Raten. Die Rate für diesen Kodierer wird auf die nächst höhere Rate erhöht und P wird erneut berechnet. Dieser Prozess wird fortgeführt bis P einen Gesamtleistungsschwellenwert T übersteigt, wobei die Prozedur zu diesem Zeitpunkt beendet wird. Eine verbesserte Möglichkeit bestünde darin, die Prozedur auf Raten-/Qualitättabellen-Einträge anzuwenden, die durch die Sendeverstärkung gewichtet wurden, die jedem Kodierer zugeordnet ist. Diese würde von dem Leistungspegelblock (110) extrahiert. Dem Fachmann ist klar, dass die Gesamtwirkung von dieser Prozedur darin besteht, die Leistung zu verringern, indem die Rate von denjenigen Kodierern geopfert wird, die durch den Betrieb mit einer niedrigeren Rate unter der kleinsten Verringerung der Qualität leiden.

Eine komplexere Möglichkeit wäre wie folgt. Es wird angenommen, wie oben, dass das Ziel (das heißt das vorherbestimmte Kriterium) des Ratenverringerungsschemas während Zeitabschnitten mit hohe Verkehrslast darin besteht, die Gesamtsendeleistung kleiner als einen Schwellenwert T zu halten, wobei T entsprechend den aktuellen Lastbedingungen eingestellt wird. Es wird ein globales Maß Q der Sprachqualität für den Sektor beziehungsweise die Zelle, die durch die Basisstation bedient wird, derart definiert, dass sie der Summe der empfindungsgemäßen Fehler für die aktuelle Gruppe von ausgewählten Raten der N Sprachkanäle entspricht. Jeder Kodierer wird initialisiert, um bei der maximalen Rate zu kodieren. Q wird dann ausgewertet und die zugehörige übertragene Leistung wird berechnet, entweder unter Verwendung der gleichen Leistungsannahme oder dem Verfahren für die gewichtete Sendeleistung, das vorstehend beschrieben wurde.

Eine Vereinfachung von diesem Verfahren würde entstehen, wenn der Ratencontroller (404) nicht verfügbar wäre, wenn jedoch jeder DSP mehrere Sprachverbindungen kodierte, indem er ein Time-sharing seiner verfügbaren Rechenleistungsressourcen vornehme. In diesem Fall würde die Ratenauswahlprozedur über die Anzahl der Sprachkanäle angewendet, für die der DSP die Kodierung durchführen würde. Fig. 6 zeigt allgemein eine Vorrichtung, die zur Verwirklichung dieses Szenarios verwendet werden kann. In Fig. 6 kommuniziert ein einziger DSP (603), beispielsweise der DSP56156 von Motorola, über einen im Zeitmultiplexverfahren betriebenen seriellen Bus oder einen herkömmlichen parallelen Adressen-/Datenbus. Die Ratenbestimmungsinformationen und die Ratenauswahlen werden zwischen dem steuernden DSP (603) und den DSPs (602) weitergeleitet, die zur Sprachkodierung verwendet werden, über den Bus (604). Alternativ kann der steuernde DSP (603) weggelassen werden und einer der Kodierer- DSPs (602) wird dazu vorgesehen, die globale Ratencontrollerfunktion und die Sprachkodierung für einen oder mehrere Sprachkanäle zu erfüllen.

Fig. 7 zeigt allgemein, in Blockschaltbildform, einen Ratencontroller (404), der in vorteilhafter Weise die Gruppenkodierung gemäß der Erfindung verwirklichen kann. Der Ratencontroller (404) weist Mittel zum Annehmen (700) von Ratenbestimmungsinformationen (401) von einer Mehrzahl von Kodierern (105) auf. Bei der bevorzugten Ausführungsform sind die Ratenbestimmungsinformationen Qualitätsinformationen, die eine empfindungsgemäß gewichtete Fehlermetrik umfassen. Der Ausgang der Mittel zum Annehmen (700) ist mit Bestimmungsmitteln (703) verbunden, die Kodieranforderungen auf der Grundlage eines vorherbestimmten Kriteriums bestimmen. Das vorherbestimmte Kriterium umfasst diejenigen, die oben als Schwellenwertkriterium angegeben wurden. Der Ausgang der Bestimmungsmittel (703) wird Einstellungsmitteln (706) zugeführt, die die Kodierrate für jeden Kodierer der Mehrzahl von Kodierern auf der Grundlage der Ratenbestimmungsinformationen und des vorherbestimmten Kriteriums einstellen. In einem Szenario, in dem das vorherbestimmte Kriterium die Gesamtsendeleistung oder der verfügbare Speicherplatz ist, erhöhen die Einstellungsmittel (706) typischerweise die Kodierrate für den Kodierer, der die schlechteste Qualität aufweist (auf der Grundlage einer Bestimmung/Berechnung von entweder der Gesamtsendeleistung oder dem verfügbaren Speicherplatz und ein Schwellenwert), wie vorstehend beschrieben. Bestimmte vorherbestimmte Kriterien, beispielsweise die Systemkapazität, können es jedoch erforderlich machen, dass die Einstellmittel (706) die Kodierrate für einen bestimmten Kodierer verringern.

Beansprucht wird:


Anspruch[de]

1. Verfahren zum Gruppenkodieren von Signalen, mit den folgenden Schritten:

Annehmen von Qualitätsinformationen von einer Mehrzahl von Kodierern;

Bestimmen von Kodieranforderungen auf der Grundlage der Qualitätsinformationen und einem vorherbestimmten Kriterium; und

Einstellen der Kodierrate für irgendeinen Kodierer der Mehrzahl von Kodierern auf der Grundlage der Qualitätsinformationen und des vorherbestimmten Kriteriums.

2. Verfahren nach Anspruch 1, bei dem das vorherbestimmte Kriterium die Gesamtausgangsleistung des Sektors beziehungsweise der Zelle, der die Kodierer zugeordnet sind, die Gesamtausgangsleistung eines benachbarten Sektors beziehungsweise einer benachbarten Zelle, den aktuellen Leistungspegel der Übertragung durch eine dienstleistenden Basisstation, die aktuelle Datenrate der zumindest zwei Kodierer, den in Speichermitteln verfügbaren Speicher oder die in einem vorherbestimmten Spektrum verfügbare Bandbreite umfasst.

3. Vorrichtung zum Gruppenkodieren von Signalen, aufweisend:

Mittel (700) zum Annehmen von Qualitätsinformationen von einer Mehrzahl von Kodierern (105);

Mittel (703), gekoppelt an die Mittel zum Annehmen, zum Bestimmen von Kodieranforderungen auf der Grundlage der Qualitätsinformationen und des vorherbestimmten Kriteriums; und

Mittel (706), gekoppelt an die Bestimmungsmittel, zum Einstellen der Kodierrate für irgendeinen Kodierer der Mehrzahl von Kodierern (105), auf der Grundlage der Qualitätsinformationen und des vorherbestimmten Kriteriums.

4. Vorrichtung nach Anspruch 3, bei der die Mittel (703) zum Bestimmen von Kodieranforderungen auf der Grundlage des vorherbestimmten Kriteriums weiterhin Mittel zum Bestimmen von Kodieranforderungen auf der Grundlage der Gesamtausgangsleistung des Sektors beziehungsweise der Zelle, der die Kodierer (105) zugeordnet sind, der Gesamtausgangsleistung eines benachbarten Sektors beziehungsweise einer benachbarten Zelle, des aktuellen Leistungspegels der Übertragung durch eine dienstleistende Basisstation (102), der aktuellen Datenrate der zumindest zwei Kodierer, des in Speichermitteln verfügbaren Speichers, der in Verarbeitungsmitteln verfügbaren Verarbeitungsleistung oder der in einem vorherbestimmten Spektrum verfügbaren Bandbreite umfassen.

5. Vorrichtung nach Anspruch 3 oder 4, bei der die Mehrzahl von Kodierern (105) weiterhin Analyse-durch- Synthese-Kodierer umfassen.

6. Vorrichtung nach Anspruch 5, bei der die Qualitätsinformationen weiterhin umfassen: empfindungsgemäß wichtende Fehlermetriken, die durch die Analyse-durch- Synthese-Sprachkodierer erzeugt werden, das S/N- Verhältnis (S/N = Signal-to-Noise / Signal-Rausch- Abstand), den segmentierten S/N, den Cepstral-Abstand, eine LPC-Abstandsmessung und eine BARK- Spektralabstandsmessung.

7. Vorrichtung nach Anspruch 3, bei der die Mehrzahl von Kodierern (105) weiterhin zumindest zwei Kodierer mit variabler Rate umfasst.

8. Vorrichtung nach Anspruch 3, bei der die Signale weiterhin Sprachsignale, Videosignale oder Datensignale umfassen.







IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com