PatentDe  


Dokumentenidentifikation DE19848588A1 29.04.1999
Titel Nichtlinearer Prozessor für akustische Echokompensatoren
Anmelder Mitel Corp., Kanata, Ontario, CA
Erfinder Reesor, Gordon J., Russell, Ontario, CA;
Jin, Qu Gary, Kanata, Ontario, CA;
Qian, Thomas, Nepean, Ontario, CA
Vertreter Lewald, D., Dipl.-Ing., Pat.-Anw., 80331 München
DE-Anmeldedatum 21.10.1998
DE-Aktenzeichen 19848588
Offenlegungstag 29.04.1999
Veröffentlichungstag im Patentblatt 29.04.1999
IPC-Hauptklasse H04M 1/58
IPC-Nebenklasse G10L 3/00   
Zusammenfassung Es ist ein nichtlinearer Prozessor (NLP) zum selektiven Beseitigen oder Reduzieren von Restechosignalen aus einem akustischen, einer Telefonendstelle zugeordneten Echokompensator vorgesehen. Niedrigpegel-Hintergrundgeräusche und Nahend-Sprachsignale durchlaufen die NLP-Struktur im wesentlichen unverändert. Verzerrungen, Hintergrundgeräusche oberhalb einer vorher festgelegten Schwelle und Echosignale einschließlich Echos von langer Dauer werden durch eine lineare Kombination vorhergehender Geräuschdaten ersetzt. Der NLP nach der Erfindung findet z. B. Verwendung bei Lauthörtelefonen und Sprachkonferenzsystemen.

Beschreibung[de]

Die Erfindung bezieht sich auf das Gebiet der adaptiven Sprachechokompensation und insbesondere auf die akustische Echokompensation für Lauthörtelefone und Sprachkonferenzsysteme unter Benutzung eines nichtlinearen Prozessors (NLP).

Nichtlineare Prozessoren (NLPs) werden allgemein bei der Echokompensation und insbesondere für die Echokompensation von akustischen Sprachsignalen benutzt. Die Sprachechokompensation läßt sich in zwei Hauptkategorien einteilen, nämlich in die Netzwerkechokompensation und in die akustische Echokompensation. Der Hauptunterschied zwischen akustischen Echosignalen und Netzwerkechosignalen besteht darin, daß ein akustischer Echosignalkanal sowohl einen Lautsprecher- als auch einen Mikrofonwandler enthält, die elektrische Signale in hörbare (akustische) Signale bzw. akustische Signale in elektrische Signale umwandeln, im Gegensatz zu Netzwerkechosignalen, die durch elektrische Schaltungen (Hybride) erzeugt werden. Der akustische Typ hat artgemäß hohe, aufgrund der umgebenden Umwelt vorhandene Hintergrundgeräuschsignale, was eine Anwendung von dem Stand der Technik entsprechenden, nichtlinearen Prozessoren ungünstig macht.

Der Begriff "nichtlinearer Prozessor" oder NLP läßt sich benutzen, um einen Signalverarbeitungsschaltkreis oder -algorithmus zu beschreiben, der im Sprachweg nach der Echokompensation angeordnet ist, um eine weitere Dämpfung oder eine Beseitigung von Restechosignalen vorzusehen, die nicht vollständig durch einen Echokompensator kompensiert werden können. Eine Nichtlinearität, eine Verzerrung oder ein hinzugefügtes Geräuschsignal sind Beispiele von Signalen, die nicht vollständig durch einen Echokompensator ausgelöscht werden können und diese Signale werden in typischer Weise durch einen nichtlinearen Prozessor beseitigt oder gedämpft.

Ein Beispiel eines dem Stand der Technik entsprechenden NLP ist ein "Mittenbegrenzer", bei dem alle Signalabtastungen mit einer Amplitude, die kleiner als ein Schwellenwert ist, auf null gesetzt werden. Dieses Verfahren wird für die Netzwerkechokompensation seit vielen Jahren von vielen verschiedenen Gerätelieferanten benutzt. Eine Beschreibung der Arbeitsweise eines solchen NLPs ist im Anhang der ITU-T G.165-Empfehlung als ein Referenzplan für einen NLP enthalten. Ein bekanntes Problem mit diesem NLP-Typ ist die sogenannte "Störaustastungs"-Erscheinung, bei dem ein Teilnehmer, der das sich ergebende Sprachsignal hört, nach einem mittenbegrenzenden NLP die Hintergrundgeräuschsignale in abklingender Weise hört, die dann wieder während Aktivierungs- und Deaktivierungsperioden des NLPs auftreten.

Verbesserungen bei diesem Mittelbegrenzungsverfahren, die das "Störaustastungs"-Problem verringern oder beseitigen, sind in den letzten Jahren vorgestellt worden. Diese Verbesserungen werden in erster Linie bei Echokompensatoren vom Netzwerktyp benutzt, bei denen Hintergrundgeräuschpegel in typischer Weise im Vergleich zu den Geräuschpegeln, die bei akustischen Echosignalen auftreten, sehr niedrig sind. Ein Beispiel einer NLP-Verbesserung gemäß dem Stand der Technik ist ein Mittenbegrenzungsverfahren, das mit der Injektion einer angepaßten künstlichen Geräuschquelle zum Maskieren der Beseitigung der Rauschsignale durch die Mittenbegrenzung kombiniert ist. Noch ein weiteres Beispiel ist eine variable Dämpfungseinrichtung, die für einen weich geschalteten Übergang zwischen den Ein/Aus-Zuständen der Signaldämpfung mit komplementärer, weich geschalteter Injektion künstlichen Rauschens sorgt. Im US-Patent 5,274,705, das am 28. Dezember 1993 Younce et al. erteilt wurde, ist ein weiteres Beispiel eines verbesserten NLP beschrieben, bei dem eine Doppelschwelle bei der NLP- Übertragungsfunktion benutzt wird, was eine transparente Übertragung von Signalen mit niedrigem Pegel ermöglicht, wenn sie unter der unteren Schwelle liegen, und eine transparente Übertragung großer Signale erlaubt, wenn sie oberhalb einer oberen Schwelle liegen, während beliebige, zwischen diesen beiden Schwellen liegende Signale beseitigt oder geändert werden.

Es treten wegen der höheren Geräuschpegel Schwierigkeiten bei allen vorstehend erwähnten Verfahren auf, wenn es sich um Signale aus einer akustischen Umgebung handelt. Geräuschinjektionsverfahren werden in typischer Weise deswegen nicht benutzt, weil sich der Charakter des Hintergrundgeräusches ganz merklich ändert, wenn anstelle des ursprünglichen Geräusches ein künstliches Geräusch injiziert wird. Es hat den Anschein, daß Verfahren mit veränderlicher Dämpfung ohne Geräuschinjektion zur Steuerung des Restechos in akustischen Echokompensatoren am meisten benutzt werden. Dies scheint eine Erweiterung der früher benutzten Verfahren mit Halbduplex-Lauthörtelefonen und Netzwerk-Echo sperren zu sein, die komplementäre Dämpfungseinrichtungen benutzten, um Schaltdämpfungen zum Echosteuern vorzusehen. Es hat sich gezeigt, daß der Einsatz der Echokompensation für ein "Vollduplex"-Freisprechtelefon auch von bekannten komplementären Dämpfungseinrichtungen mit reduzierter "Dämpfungstiefe" Gebrauch macht, um die Verbindung nahezu im Vollduplex oder vielleicht subjektiv im "Vollduplex" auszuführen. Einige andere Ausführungen scheinen eine vollständige Vollduplex-Kommunikation zeitweise zu ermöglichen (z. B. während Gegensprechperioden), während eine besondere Dämpfungssteuerung von Echoresten während anderer Zeitperioden (z. B. Einzelsprechperioden) vorgesehen ist. Alle diese Verfahren rufen hörbare Änderungen bei den Hintergrundgeräuschsignalen hervor, was eine Verringerung der gesamten subjektiven Wirksamkeit erzeugt.

Wenn das bekannte Doppelschwellenverfahren bei akustischen Hintergrundgeräuschsignalen angewandt wird, erzeugt es merkbare Pegel einer zusätzlichen Signalverzerrung. Diese Verzerrung wird durch die den Signalen zugefügten Änderungen verursacht, wenn der NLP eingeschaltet ist. Diese hörbare Verzerrung ändert den Charakter des Hintergrundgeräusches während des Sprechens vom fernen Ende und läßt sich am besten als eine Art von kratzigem Geräusch mit Hochfrequenzkomponenten beschreiben, das anders klingt als ein typisches Hintergrundgeräusch. Es ist darauf hinzuweisen, daß der Sprecher am fernen Ende im Laufe dieser Beschreibung der Teilnehmer ist, der das sich nach dem NLP ergebende Signal auch hört.

Ein weiteres Problem mit dem NLP entsprechend dem Stand der Technik besteht darin, daß er keine Steuerung über eine Umgebung mit langem Echoweg hat. Zur Kostenersparnis können die meisten Echokompensatoren nur mit einer kurzen Echolänge (z. B. 128 ms oder weniger) umgehen. In einigen akustischen Umgebungen kann das Echo etwa 0,5 bis 1 sek andauern. Obwohl in den meisten Fällen der Echorest nach 128 ms sehr klein ist, ist sogar ein sehr kleiner Echorest feststellbar, wenn beide Seiten der Telefonleitung ruhig sind. Nachdem der Lautsprecher für über eine 1/2 sec ruhig gewesen ist, kann das Echo noch am Mikrofoneingang vorhanden sein. Der Echorest wird vom Lauthörtelefon als Nahend-Einzelsprechen behandelt, und deswegen dämpft der NLP dieses Signal nicht.

Das bei der vorliegenden Erfindung benutzte Verfahren baut auf dem Doppelschwellenverfahren auf. Der NLP wird nur dann eingeschaltet, wenn sowohl eine Gegensprechbedingung als auch ein Echosperrbedürfnis vorliegen.

Die vorliegende Erfindung bezieht sich des weiteren auf ein Verfahren zum Reduzieren des Pegels der zusätzlichen Signalverzerrung durch Verarbeiten von Signalen in einer gegenüber den im Zusammenhang mit bekannten NLP-Anordnungen beschriebenen Verfahren verschiedenen Weise. Das Signal soll transparent sein, wenn es als Geräusch detektiert wird, sonst wird ein Geräuschvorhersagewert ausgesendet.

Bei der vorliegenden Erfindung wird der Langechorest mit der neuen NLP-Struktur behandelt. In Labortests ist der Echorest mit der neuen NLP-Struktur erheblich reduziert, sogar im Falle, wenn Echosignale bis zu 1 sek andauern, und der Anpassungsalgorithmus kann nur 100 ms Echolänge behandeln.

Kurz gesagt, die NLP-Struktur nach der vorliegenden Erfindung bestimmt, ob das Restsignal des Echokompensators größer oder kleiner als ein geschätzter Geräuschpegel ist. Wenn es kleiner als der geschätzte Geräuschpegel ist, wird das Restsignal durch den NLP im wesentlichen unverändert durchgelassen. Wenn das Restsignal größer als der geschätzte Geräuschpegel ist, wird es weiter ausgewertet, um zu bestimmen, ob es ein Nahend-Sprachsignal ist oder nicht. Wenn es Sprache ist, wie beim Nahend-Einzelsprechen oder -Gegensprechen, wird das Restsignal wieder durch den NLP unverändert durchgelassen. Wenn jedoch das eintreffende Signal ein Echorest oder Langzeitecho ist, gibt der NLP als Ausgangssignal ein Niedrigpegel-Geräuschsignal ab, das eine auf vorhergehenden Geräuschabtastungen beruhende Vorhersage darstellt.

Deswegen ist gemäß einem ersten Gesichtspunkt der vorliegenden Erfindung ein nichtlinearer Prozessor (NLP) zum Gebrauch mit einem akustischen, einer Telefonendstelle zugeordneten Echokompensator vorgesehen, um selektiv davon Restsignale zu reduzieren. Der NLP umfaßt: einen ersten Eingang zum Empfangen der Restsignale; einen zweiten Eingang zum Empfangen eines Bezugssignals, das ein Signal von einem Benutzer am anderen Ende darstellt; einen dritten Eingang zum Empfangen eines Nahend-Signals von einem Mikrofon in der Endstelle; einen Ausgang zum Liefern eines NLP-Ausgangssignals zu einem Benutzer am anderen Ende; einen NLP-Schalter, der zwischen einer ersten Position, in welcher das Restsignal direkt zum Ausgang durchgelassen wird, und einer zweiten Position, in welcher ein ein vorhergehendes Geräuschsignal darstellendes Signal an den Ausgang geliefert wird, umschaltbar ist; Geräuschentscheidungsmittel zum Bestimmen, ob das Restsignal oberhalb eines Geräuschpegels ist und, wenn nicht, zum Umschalten des NLP-Schalters in die erste Position; und mit den Geräuschentscheidungsmitteln zusammenwirkende NLP-Entscheidungsmittel zum Umschalten des NLP-Schalters in die erste Position, wenn das Restsignal Nahend-Sprache enthält, und andernfalls in die zweite Position.

Bei einer bevorzugten Ausführung enthalten die Entscheidungsmittel ein Echosperr-Schwellenmittel, das bestimmt, ob das Restsignal ein Langecho ist, das nicht vom Echokompensator kompensiert worden ist. Wenn es ein Langecho ist, bleibt der Schalter in der zweiten Position, in welcher Niedrigpegel-Geräuschdaten zum NLP-Ausgang vorgesehen sind.

Gemäß einem zweiten Gesichtspunkt der vorliegenden Erfindung ist ein Verfahren zum selektiven Reduzieren eines Restsignals eines akustischen, einer Telefonendstelle zugeordneten Echokompensators vorgesehen. Das Verfahren umfaßt: Bereitstellen des Restsignals an Geräuschentscheidungsmittel zum Vergleich mit einem geschätzten Geräuschpegel; Durchlassen des Restsignals direkt durch den NLP, wenn es kleiner als der geschätzte Geräuschpegel ist; Durchlassen des Restsignals zu weiteren Entscheidungsmitteln, wenn es größer als der geschätzte Geräuschpegel ist, worauf das Restsignal veranlaßt wird, durch den NLP durchgelassen zu werden, wenn es ein Nahend-Sprachsignal ist, andernfalls ein ein vorhergehendes Geräuschsignal darstellendes Signal das Ausgangssignal aus dem NLP wird.

Die Erfindung wird im folgenden im einzelnen unter Bezugnahme auf die beigefügten Zeichnungen beschrieben, in welchen zeigen:

Fig. 1 einen typischen akustischen Echokompensator mit einem darin enthaltenen NLP,

Fig. 2 ein Blockschaltbild der NLP-Struktur gemäß der vorliegenden Erfindung, und

Fig. 3A und 3B den NLP-Prozeß nach der Erfindung darstellende Flußdiagramme.

Fig. 1 zeigt einen akustischen Echokompensator mit einem darin enthaltenen nichtlinearen Prozessor (NLP) 12. In Fig. 1 ist S(n) das Nahend-Signal, R(n) das als Bezugssignal für ein adaptives Filter 14 benutzte Signal am anderen, also am fernen Ende und E(n) der Echorest, welcher die Differenz zwischen dem Signal S(n) und dessen Schätzwert ≙(n) ist.

Fig. 2 zeigt die Ausführung der neuen NLP-Struktur, die aus vier Teilen zusammengesetzt ist, nämlich aus einem Haupt-NLP- Block 20 für den Signaleingang und -ausgang, einer Geräuschentscheidungsschaltung 40 zur Prüfung, ob das Eingangssignal Rauschen oder ein aktives Signal ist, einer NLP-Steuerung 60 zum Ein- und Ausschalten des NLPs und aus einer Echoschwanzsteuerung 80 zur Prüfung, ob der Ein-Aus-NLP-Schalter durch das Nahend-Signal oder den Echorest veranlaßt wird, zu lang zu sein, um durch das adaptive Filter 14 kompensiert zu werden.

Wie in der Fig. 2 gezeigt ist, wird das Echorestsignal E(n) dem NLP-Block 20 und der Geräuschentscheidungsschaltung 40 eingespeist. Der NLP-Block 20 enthält einen Schalter 22, einen Schalter 24 und ein Filter 26. Die Betätigung des Schalters 22 wird durch das Ausgangssignal eines UND-Gatters 30 gesteuert, so daß, wenn das Ausgangssignal des UND-Gatters 30 "1" ist, das Ausgangssignal des Schalters 22 durch das Filter 26 bereitgestellt wird, d. h. S = 1, und wenn das Ausgangssignal des UND-Gatters 30 "0" ist, das Ausgangssignal des Schalters 22 ein direkter Durchgang von E(n) ist. Dies ist in der Fig. 2 als S = 0 gezeigt. Der Schalter 24 wird durch das Ausgangssignal eines Vergleichers 46 der Geräuschentscheidungsschaltung 40 gesteuert, so daß eine logische "1" zum Schalter 24 den Schalter veranlaßt, ein "0"-Eingangssignal zum Filter 26 bereitzustellen, und eine logische "0" zum Schalter 24 veranlaßt E(n), in das Filter 26 eingespeist zu werden.

Die Geräuschentscheidungsschaltung 40 enthält einen Absolutsignaldetektor (ABS) 42, einen Geräuschpegeldetektor 44 und den Vergleicher 46. Der Zweck der Geräuschentscheidungsschaltung 40 besteht in der Überwachung des Restechos E(n) unter Bezug auf einen geschätzten Geräuschpegel. Wenn der Pegel von E(n) niedriger als der Geräuschpegel (Tnoise) ist, ist das Ausgangssignal des Vergleichers 46 eine "0". Der Geräuschpegel kann mit jedem gewöhnlichen Geräuschpegel-Detektionsalgorithmus geschätzt werden, der durch den Geräuschpegeldetektor 44 ausgeführt wird, dessen Ausgangssignal Tnoise ist. Die "0" am Ausgang des Vergleichers 46 wird einem Eingang 32 des UND- Gatters 30 eingespeist, das den Schalter 22 auf S = 0 schaltet und, wie vorher bereits erörtert wurde, das Restechosignal E(n) wird durch die NLP-Struktur direkt durchgelassen. Jedes beliebige Restecho, dessen Pegel kleiner als eine vorher festgelegte Geräuschschwelle ist, wird somit durch den NLP nicht verändert. Diese "0" am Ausgang des Vergleichers 46 wird auch zum Schalter 24 bereitgestellt, so daß gemäß der vorher geführten Erörterung das Signal E(n) auch in den Eingang des Filters 26 eingespeist wird. Weil sich der Schalter 22 in der Position S = 0 befindet, wird das Signal E(n) nicht mit dem Ausgang Sout verbunden, ist aber vielmehr das Ausgangssignal des Filters 26. Das Filter 26 ist normalerweise ein preiswertes FIR-Filter mit Tiefpaßcharakteristik. Es nimmt die Geräuschabtastungen beim Signal E(n) vor, glättet sie und gibt sie nachfolgend am Ausgang als einen Geräuschvorhersagewert aus.

Wenn der Wert des Signals E(n) größer als die vorhergesagte Geräuschschwelle ist, ist das Ausgangssignal des Vergleichers 46 eine "1" und diese "1" erscheint am Eingang 32 des UND- Gatters 30 sowie zum Schalter 24, wodurch der Schalter 24 auf S = 1 umgeschaltet wird. Bei diesem Aufbau empfängt der Schalter 24 das "0"-Eingangssignal, das dem Filter 26 eingespeist wird. Der Betrieb des Schalters 22 ist nun in diesem Modus von der aus dem ODER-Gatter 50 heraus kommenden NLP-Entscheidung abhängig. Wie in der Fig. 2 dargestellt ist, hat das ODER-Gatter 50 zwei Eingänge, nämlich den Eingang 52 vom NLP- Steuerblock 60 und den Eingang 54 von der Echoschwanzsteuerung 80.

Es wird zuerst der NLP-Steuerblock 60 betrachtet, der zwei Vergleicherschaltungen aufweist, nämlich eine für Gegensprechdetektion und die andere für eine Situation, bei welcher der in der Fig. 1 gezeigte Echokompensator für keine genügende Echokompensation sorgt. Dies könnte der Fall sein wegen langer Echos, weil der adaptive Algorithmus nicht ausreichend konvergiert oder wegen eines kleinen Echos mit einem geringen Gegensprechen. Die Gegensprechvergleicherschaltung enthält einen Pegeldetektor 62, eine Dämpfungsschwelle 64, einen Vergleicher 66 und ein Nachwirk-Zeitglied 68. Wenn der Wert des Signals E(n) größer als der Geräuschpegel ist, jedoch kein Nahend-Sprechen ist, ist der Wert von E(n) geringer als der mit einer Dämpfungsschwelle (Tloss) multiplizierte Pegel von R(n). Unter diesen Bedingungen ist das Ausgangssignal des Vergleichers 66 eine "1", welche dem Eingang 67 des UND-Gatters 70 eingespeist wird. Unter denselben Bedingungen, d. h. keinem Nahend-Sprechen, ist der Wert des Signals E(n) kleiner als der mit einer Sperrdämpfung Tsup multiplizierte Wert von S(n), und in dieser Situation ist das Ausgangssignal des Vergleichers 76 eine "1". Somit wird das Ausgangssignal des UND-Gatters 70 auch eine "1" und daher ist die NLP-Entscheidung eine "1", was seinerseits bedeutet, daß sich der Schalter 22 in der Position S = 1 befindet und das Ausgangssignal der NLP-Struktur ein gefilterter Wert einer vorhergehenden Abtastung ist. Jedes beliebige Restecho wird somit durch den NLP reduziert oder aus dem Signal beseitigt, bevor es zu einem Teilnehmer am anderen, fernen Ende gesendet wird.

Wenn Gegensprechen auftritt, d. h. der Sprecher am anderen Ende spricht und der Sprecher am nahen Ende ebenfalls spricht, stellt das Signal E(n) nun eine aktive Sprachkommunikation dar und soll durch die NLP-Struktur direkt durchgelassen werden. Wenn es eine Gegensprechsituation gibt, steigt das negative Eingangssignal des Vergleichers 66 über den mit Tloss multiplizierten Pegel von R(n) und das Ausgangssignal des Vergleichers 66 schaltet auf eine "0" um. Das Nachwirk- Zeitglied 68 verzögert einfach das Hinüberschalten von "0" auf "1" um eine vorgewählte Dauer, um die Gegensprech-Detektierzeit auszudehnen. Bei jedem Ereignis führt eine "0" an einem der Eingänge zum UND-Gatter 70 zu einer "0", die einem der Eingänge zum ODER-Gatter 50 zugeführt wird. Unter normalen Umständen ist das Ausgangssignal des UND-Gatters 90 bei der Echoschwanzsteuerung 80 auch eine "0", so daß das UND- Gatter 30 auch auf ein "0"-Ausgangssignal umschaltet, was beim Schalter 22 zu einem Umschalten auf S = 0 und zu Sout = E(n) führt. Das Restecho, das nun die Sprache von einem Nahend- Teilnehmer enthält, wird folglich durch die NLP-Struktur unverändert durchgelassen.

Ein anderes Szenario, das auftreten könnte, ist, wenn der Teilnehmer am anderen Ende still ist, aber der Teilnehmer am nahen Ende spricht, d. h. ein Nahend-Einzelsprechen vorliegt, und wiederum dieses Restsignal durch die NLP-Struktur ohne Veränderung durchgelassen werden soll. Diese Situation wird durch die vorher erwähnte Struktur und eine Struktur abgedeckt, die einen Pegeldetektor 72, eine Echosperrschwelle 74 und einen Vergleicher 76 enthält. In dieser Situation sinkt der mit Tsup multiplizierte Pegel des Signals S(n) unter den Pegel des Signals E(n) und das Ausgangssignal des Vergleichers 76 schaltet von einer "1" auf eine "0" um. Diese "0" am Eingang 71 des UND-Gatters 70 führt zu einer "0" am Eingang 52 des ODER-Gatters 50 und wiederum wird der Schalter 22 auf S = 0 umgeschaltet, wobei dafür gesorgt wird, daß das Ausgangssignal des Echoschwanz-UND-Gatters 50 eine "0" ist, und der Wert von E(n) wird an Sout bereitgestellt.

Es gibt eine zusätzliche Bedingung, die betrachtet werden muß und darin besteht, daß die Situation, bei der das Nahend-Signal als Nahend-Sprache erscheint, jedoch tatsächlich ein Langzeitecho ist, so wie es bei einem Lauthörtelefon oder dergleichen vorkommt. Das adaptive Filter im in Fig. 1 gezeigten und vorher erörterten Echokompensator arbeitet normalerweise nur bei einer kurzen Echolänge, z. B. 128 ms oder weniger. Ein Echo, das länger als diese Zeitdauer anhält, erscheint im Restechosignal E(n), und ohne das Verdienst der Echoschwanzsteuerung der vorliegenden Erfindung würde es durch die Struktur mit der falschen Entscheidung, nämlich daß es eine Nahend-Sprache darstellt, durchgelassen werden. Wenn der Vergleicher 76 also von einem "1"- auf ein "0"-Ausgangssignal umschaltet, was eine Nahend-Sprache anzeigt, wird das Ausgangssignal des UND-Gatters 70 zum ODER-Gatter 50 eine "0". Zu dieser Zeit bestimmt der Echoschwanz-Steuerblock 80, der ein Restpegellaufzeitglied 82, eine Schwelle 84, ein NLP-Entscheidungslaufzeitglied 86 und einen Vergleicher 88 aufweist, ob der Stromwert von E(n), d. h. von Pk, in der Fig. 2 größer oder kleiner als ein vorhergehender Wert von Pk, d. h. Pk-1, ist. Wenn der vorhergehende Wert Pk-1 (mit einer Schwelle γ) größer als Pk ist, was auf ein ausschwingendes Signal hinweist, d. h. ein Langzeitecho, gibt der Vergleicher 88 ein Ausgangssignal "1" ab. Da das Ausgangssignal des ODER-Gatters 50 auch eine "1" aus der vorhergehenden Zeit ist, wird diese "1" durch das Entscheidungslaufzeitglied 86 in den Eingang 91 des UND- Gatters 90 eingespeist. Das andere Eingangssignal 93 des UND- Gatters 90 ist auch eine "1" aufgrund des Ausgangssignals des Vergleichers 88. Das ODER-Gatter 50 fährt fort, eine "1" als Ausgangssignal aus zugeben, so daß Sout vielmehr der gefilterte Geräuschwert und nicht E(n) ist, wenn E(n) oberhalb des Geräuschpegels liegt. Wenn der Wert von E(n) ansteigt, so daß Pk größer oder gleich Pk-1, multipliziert mit γ, ist, schaltet der Vergleicher 88 auf ein "0"-Ausgangssignal um und im Ergebnis wird die NLP-Entscheidung "0" und E(n) wird wiederum direkt durchgelassen zu Sout. Dieser Anstieg von E(n) könnte beispielsweise eine Situation anzeigen, bei der es einen Nahend-Sprecher und/oder eine Gegensprechsituation gibt.

Der Echoschwanz-Steuerblock 80 sorgt für die hinzugefügte Funktionalität der Beseitigung von Echos, die einen langen Schwanz haben, die andernfalls durch die NLP-Struktur auf der Grundlage durchgelassen werden würden, daß sie als Nahend- Sprache fehlinterpretiert worden sind.

Fig. 3A und 3B sind Flußdiagramme, welche die von der NLP- Struktur ausgeübten Prozeßschritte darstellen.

Gemäß der vorliegenden Erfindung lassen sich verschiedene Alternativen einführen. Beispielsweise kann Pk so gewählt werden, daß es nicht auf den neuesten Stand gebracht wird, wenn die NLP-Steuerung "0" und die NLP-Entscheidung "1" ist, was bedeutet, daß der NLP wegen eines langen Echoschwanzes im eingeschalteten Zustand ist. Der Vorteil davon ist, daß Pk-1 während des Echoschwanzes nicht gesteigert wird, und es für den NLP eine bessere Wahrscheinlichkeit gibt, im eingeschalteten Zustand zu bleiben, um einen langen Echoschwanz zu bekämpfen. Der NLP wird durch eine gelegentliche Pegelverminderung während der Echoschwanzperiode nicht freigegeben. Der Nachteil ist der, daß es ein wenig länger dauern könnte, um den NLP freizugeben, wenn beide Enden der Telefonleitung ruhig sind.

Es können auch alle Pegelberechnungen durch Energieberechnungen ersetzt werden. Der Nachteil davon ist, daß die Energie im Vergleich zur Pegelspitze langsam reagiert.

Im folgenden werden einige der Parameterauswahlen für die NLP-Auslegung dargestellt.

  • 1. Schwelle für die NLP-Schwanzentscheidung (γ): Ein großes γ macht es schwer, den NLP freizugeben, wenn beide Telefonenden ruhig sind. Auf der anderen Seite macht es ein kleines γ schwer, den Echoschwanz zu detektieren, weil der Echoschwanzpegel nicht streng monoton abnehmen muß. In einigen Fällen kann der Restpegel gelegentlich während der Echoschwanzperiode gesteigert werden, und der NLP kann durch diese Pegelzunahme ausgeschaltet werden, wenn γ zu klein ist. Ein geeigneter Wert für γ bei der akustischen Echokompensation ist 1,05.
  • 2. Die Funktion des Filters besteht im Ersetzen der fehlenden Geräuschabtastungen. In der akustischen Echoumgebung ist das Hintergrundgeräusch nicht weiß, sondern farbig und zwar mit Tiefpaßcharakteristiken. Deswegen sollte ein Tiefpaßfilter zum Wiedergewinnen von Geräuschabtastungen benutzt werden. Ein einfaches und wirksames Filter ist ein FIR-Filter mit vier Anzapfungen, wobei sein erster Koeffizient null ist: [0; 0,29469694; 0,34868972; 0,20388524].
  • 3. Die Gegensprechschwelle (Tloss) sollte ebenfalls sorgfältig gewählt werden. Wenn sie zu groß ist, läßt sich Gegensprechen nicht wirksam detektieren, und wenn sie zu klein ist, kann der NLP nicht gut funktionieren, weil der Gegensprechdetektor eine Menge von falschen Gegensprechanzeigen abgeben kann. Ein geeigneter Wert für Tloss beträgt 0,5.
  • 4. Das gewählte Kriterium für das Gegensprech-Nachwirkzeitglied ist dasselbe wie bei der Gegensprechschwelle. Wenn es zu klein ist, kann der Gegensprechdetektor nicht gut arbeiten und eine Fülle von Nahend-Sprachbegrenzung kann von den Hörern am anderen Ende gehört werden. Wenn das Nachwirk-Zeitglied zu groß ist, nimmt es eine lange Zeit in Anspruch, um die Gegensprechentscheidung freizugeben und der NLP kann nicht gut arbeiten, um das Restecho wirksam zu beschneiden. Ein geeigneter Wert für das Nachwirk-Zeitglied beträgt 400 Abtastungen.
  • 5. Die Schwelle für die Echosperrung (Tsup) darf einen relativ breiten Bereich haben. Sie ist ein sicherer Schutz beim geringen Nahend-Gegensprechen. Ein sehr geringes Nahend-Gegensprechen kann durch den Gegensprechdetektor nicht detektiert werden, aber es verschlechtert die Echokompensatorleistung erheblich. In einem solchen Falle sollte eine Echosperrpegeldetektion verwendet werden. Eine hohe Echosperrschwelle bedeutet, daß ein geringes Gegensprechen in der Echoumgebung nicht wirksam detektiert werden kann, und eine niedrige Schwelle besagt, daß der NLP nicht ohne Schwierigkeit einschaltet. Mit einer sehr niedrigen Schwelle ist es sehr schwierig oder nimmt es zumindest eine lange Zeit in Anspruch, den NLP einzuschalten, weil der NLP nur betätigt wird, wenn ein großer Betrag von Echosperrung durch den adaptiven Echokompensator erreicht wird. Ein geeigneter Wert für die Schwelle ist Tsup = 0,2.

Im folgenden werden einige Definitionen aufgeführt, die für das Verständnis der Erfindung hilfreich sein können.

NLP: Nichtlinearer Prozessor, der zur Beseitigung oder weiteren Dämpfung von Restechosignalen nach einer Echokompensation benutzt wird.

Adaptives Filter: Ein adaptiver Algorithmus zum Simulieren des Echoweges, so daß das Echo durch Subtrahieren seines geschätzten Wertes beseitigt werden kann.

Gegensprechdetektor: Er detektiert die Gegensprechbedingung (wenn sowohl die Signale am nahen Ende als auch am anderen, fernen Ende existieren).

Pegeldetektor: Ein rekursiver Algorithmus zum Detektieren des spitzengemittelten Wertes des Signals.

Geräuschpegeldetektor: Ein rekursiver Algorithmus zum Schätzen des Pegels des Hintergrundgeräusches.

Obwohl eine besondere Ausführung der Erfindung beschrieben und dargestellt worden ist, ist es einem Fachmann klar, daß am grundsätzlichen Konzept zahlreiche Abänderungen ausgeführt werden können. Es ist jedoch selbstverständlich, daß solche Abänderungen innerhalb des Umfangs der Erfindung liegen, wie er durch die beigefügten Ansprüche definiert ist.


Anspruch[de]
  1. 1. Nichtlinearer Prozessor (NLP) zum Gebrauch mit einem akustischen Echokompensator, der einer Telefonendstelle zugeordnet ist, um selektiv aus dem Echokompensator Restsignale zu reduzieren, wobei der NLP umfaßt: einen ersten Eingang zum Empfangen der Restsignale; einen zweiten Eingang zum Empfangen eines Bezugssignals, das ein Signal von einem Benutzer am anderen Ende darstellt; einen dritten Eingang zum Empfangen eines Nahend-Signals von einem Mikrofon in der Endstelle; einen Ausgang zum Liefern eines NLP-Ausgangssignals zu einem Benutzer am anderen Ende; einen NLP-Schalter, der zwischen einer ersten Position, in welcher das Restsignal direkt zum Ausgang durchgelassen wird, und einer zweiten Position, in welcher ein ein vorhergehendes Geräuschsignal darstellendes Signal an den Ausgang geliefert wird, umschaltbar ist; Geräuschentscheidungsmittel zum Bestimmen, ob das Restsignal oberhalb eines Geräuschpegels ist und, wenn nicht, zum Umschalten des NLP-Schalters in die erste Position; und mit den Geräuschentscheidungsmitteln zusammenwirkende NLP-Entscheidungsmittel zum Umschalten des NLP-Schalters in die erste Position, wenn das Restsignal Nahend-Sprache enthält, und andernfalls in die zweite Position.
  2. 2. NLP nach Anspruch 1 mit einem Filtermittel zur dynamischen Wiederberechnung des vorhergehenden Geräuschsignals, wenn das Restsignal größer als der Geräuschpegel ist.
  3. 3. NLP nach Anspruch 1, bei dem das NLP-Entscheidungsmittel Mittel zum Vergleichen des Restsignals mit dem Bezugssignal und zum Veranlassen des NLP-Schalters zu einer Umschaltung in die erste Position enthält, wenn das Restsignal größer als ein eingestellter Bezugssignalpegel ist, wodurch eine Gegensprechsituation angezeigt wird.
  4. 4. NLP nach Anspruch 3, der außerdem ein Zeitglied zum Verzögern des Umschaltens des NLP-Schalters bis zu einem Zeitpunkt enthält, nach dem eine voreingestellte Zeitdauer verstrichen ist.
  5. 5. NLP nach Anspruch 1, bei dem die NLP-Entscheidungsmittel Mittel zum Vergleichen des Restsignals mit dem Nahend- Signal und zum Umschalten des NLP-Schalters in die erste Position enthält, wenn das Restsignal größer als ein voreingestellter Nahend-Signalpegel ist.
  6. 6. NLP nach Anspruch 5, der außerdem Mittel zum Bestimmen, ob das Restsignal ein langes Echo ist, und zum Halten des Schalters in der zweiten Position aufweist, wenn dies so ist.
  7. 7. Mit einem akustischen Echokompensator in einer Telefonendstelle verbundener, nichtlinearer Prozessor, der umfaßt Eingangsmittel zum Empfangen eines Restechosignals aus dem Echokompensator; Entscheidungsmittel zum Bestimmen, ob das Restechosignal ein Signal darstellt, das zur Endstelle übertragen werden soll; und Mittel zum Durchlassen dieses Signals, wenn es übertragen werden soll, andernfalls das Signal durch ein berechnetes Geräuschsignal ersetzt wird.
  8. 8. Nichtlinearer Prozessor nach Anspruch 7, bei dem die Entscheidungsmittel Geräuschdetektionsmittel enthalten, um zu bestimmen, ob das Restechosignal einen Pegel hat, der größer als ein Schwellengeräuschpegel ist.
  9. 9. Nichtlinearer Prozessor nach Anspruch 7, bei dem das zu übertragende Signal Nahend-Sprachsignale enthält, die von der Endstelle ausgehen.
  10. 10. Nichtlinearer Prozessor nach Anspruch 7, bei dem Signale, die nicht übertragen werden sollen, ein Langzeitecho enthalten, das andernfalls durch den Echokompensator kompensiert wird.
  11. 11. Verfahren zum selektiven Reduzieren eines Restsignals von einem akustischen, Echokompensator, der einer Telefonendstelle zugeordnet ist, wobei das Verfahren umfaßt:

    Bereitstellen des Restsignals an Geräuschentscheidungsmittel in einem nichtlinearen Prozessor (NLP) zum Vergleich mit einem geschätzten Geräuschpegel; Durchlassen des Restsignals direkt durch den NLP, wenn es kleiner als der geschätzte Geräuschpegel ist; Durchlassen des Restsignals zu weiteren Entscheidungsmitteln, wenn es größer als der geschätzte Geräuschpegel ist, worauf das Restsignal veranlaßt wird, durch den NLP durchgelassen zu werden, wenn es ein Nahend-Sprachsignal ist, andernfalls ein ein vorhergehendes Geräuschsignal darstellendes Signal das Ausgangssignal aus dem NLP wird.
  12. 12. Verfahren nach Anspruch 11, bei dem die weiteren Entscheidungsmittel bestimmen, ob das Restsignal Gegensprechen enthält.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com