PatentDe  


Dokumentenidentifikation DE602004001564T2 28.06.2007
EP-Veröffentlichungsnummer 0001530200
Titel Werkzeug zur Qualitätserfassung
Anmelder Psytechnics Ltd., Ipswich, GB
Erfinder Malfait, Ludovic, Ipswich, IP4 1NX, GB
Vertreter Maikowski & Ninnemann, Pat.-Anw., 10707 Berlin
DE-Aktenzeichen 602004001564
Vertragsstaaten AT, BE, BG, CH, CY, CZ, DE, DK, EE, ES, FI, FR, GB, GR, HU, IE, IT, LI, LU, MC, NL, PL, PT, RO, SE, SI, SK, TR
Sprache des Dokument EN
EP-Anmeldetag 26.05.2004
EP-Aktenzeichen 042531376
EP-Offenlegungsdatum 11.05.2005
EP date of grant 19.07.2006
Veröffentlichungstag im Patentblatt 28.06.2007
IPC-Hauptklasse G10L 19/00(2006.01)A, F, I, 20051017, B, H, EP

Beschreibung[de]

Die vorliegende Erfindung betrifft einen für die Verwendung in einem nicht-intrusiven Sprachqualitätsbewertungssystem geeigneten neuen Parameter.

Über Telekommunikationsverbindungen geführte Signale können beträchtlichen Transformationen unterzogen werden, wie z.B. Digitalisierung, Verschlüsselung und Modulation. Außerdem können sie aufgrund von Auswirkungen verlustbehafteter Komprimierung und Übertragungsfehlern verzerrt werden.

Objektive Prozesse zum Zwecke des Messens der Qualität eines Signals werden zur Zeit entwickelt und finden in der Geräteentwicklung, Geräteprüfung und Erfassung der Systemleistungsfähigkeit Anwendung.

Bestimmte automatisierte Systeme erfordern das Abspielen eines bekannten (Referenz-)Signals durch ein verzerrendes System (das Kommunikationsnetz oder ein anderes System, das gerade geprüft wird), um ein verschlechtertes Signal abzuleiten, das mit einer unverzerrten Version des Referenzsignals verglichen wird. Solche Systeme sind als "intrusive" Qualitätserfassungssysteme bekannt, weil während der Ausführung der Prüfung der gerade geprüfte Kanal im allgemeinen keinen Live-Verkehr führen kann.

Umgekehrt sind nicht-intrusive Qualitätserfassungssysteme Systeme, die verwendet werden können, während Live-Verkehr durch den Kanal geführt wird, ohne daß Prüfverbindungen notwendig sind.

Nicht-intrusive Prüfung ist erforderlich, weil es für bestimmte Prüfungen nicht möglich ist, Prüfverbindungen herzustellen. Dies könnte der Fall sein, weil die Verbindungsendpunkte geographisch divers oder unbekannt sind. Außerdem könnte es sein, daß die Kosten der Kapazität auf der zu prüfenden Route besonders hoch sind. Im Gegensatz dazu kann eine nicht-intrusive Überwachungsanwendung die ganze Zeit an den Live-Verbindungen ablaufen, um eine sinnvolle Messung der Leistungsfähigkeit zu ergeben.

Ein bekanntes nicht-intrusives Qualitätserfassungssystem verwendet eine Datenbank verzerrter Proben, die von Gremien von menschlichen Zuhörern bewertet wurden, um eine mittlere Meinungseinstufung (MOS – mean opinion score) bereitzustellen.

MOS werden durch subjektive Prüfungen erzeugt, deren Ziel darin besteht, die Wahrnehmung eines durchschnittlichen Benutzers einer Sprachqualität eines Systems zu finden, indem einem Gremium von Zuhörern eine gezielte Frage gestellt wird und eine begrenzte Antwortauswahl gegeben wird. Um zum Beispiel die Zuhörqualität zu bestimmen, werden Benutzer gebeten, "die Qualität der Sprache" auf einer fünf-Punkte-Skala von Schlecht bis Ausgezeichnet einzustufen. Die MOS wird für einen bestimmten Zustand durch Mitteln der Einstufungen aller Zuhörer berechnet.

Um das Qualitätserfassungssystem zu trainieren, wird jede Probe parameterisiert und es wird eine Kombination der Parameter bestimmt, die die beste Vorhersage der von den menschlichen Zuhörern angegebenen MOS liefert. Die Internationale Patentanmeldung Nr. WO 01/35393 beschreibt ein Verfahren zum Parameterisieren von Sprachproben zur Verwendung in einem nicht-intrusiven Qualitätsbewertungssystem.

Die vorliegende Erfindung betrifft verbesserte Parameter für ein Sprachqualitätserfassungssystem.

Gemäß der Erfindung, wie sie in Anspruch 1 beansprucht wird, wird ein Verfahren zum Erzeugen eines Parameters aus einem Signal bereitgestellt, umfassend eine Sequenz von Werten, die von stimmhaften Teilen des Signals mit einer Abtastfrequenz gemessen werden, wobei sich der Parameter für die Verwendung in einem Qualitätserfassungswerkzeug eignet, wobei das Verfahren die folgenden Schritte umfaßt:

  • a) Auswählen eines Abschnitts des Signals;
  • b) Ausführen einer Frequenztransformation an dem Abschnitt, um eine Sequenz von Frequenzwerten bereitzustellen; und
  • c) Erzeugen einer Tonhöhenfrequenzschätzung, dadurch gekennzeichnet, daß das Verfahren ferner die folgenden Schritte umfaßt:
  • d) Auswählen einer Vielzahl von Teilen der Sequenz von Frequenzwerten in Abhängigkeit von der Tonhöhenfrequenzschätzung, wobei die Teile einen Frequenzbereich und eine Mittenfrequenz aufweisen;
  • e) Erzeugen eines Mittelwerts für jeden der Vielzahl von Teilen;
  • f) Erzeugen eines Abschnittsparameters in Abhängigkeit von der Differenz zwischen dem Mittelwert für einen Teil der Sequenz von Frequenzwerten und dem Mittelwert für einen nachfolgenden Teil der Sequenz von Frequenzwerten;
  • g) Wiederholen der Schritte a)–f), um eine Vielzahl der Abschnittsparameter bereitzustellen, und Erzeugen der Parameter durch eine Schätzung in Abhängigkeit von der Vielzahl der Abschnittsparameter.

Der Abschnitt der Sequenz von Werten kann so ausgewählt werden, daß eine Tonhöhenmarkierung mit einem Wert in der Mitte des Abschnitts assoziiert wird.

Die Frequenztransformation kann eine schnelle Fouriertransformation umfassen.

Der Schritt des Erzeugens einer Tonhöhenfrequenzschätzung kann die folgenden Schritte umfassen: Verwenden der mit der Sequenz von Werten assoziierten Tonhöhenmarkierungen; Vergleichen der Anzahl von Werten zwischen einem mit einer Tonhöhenmarkierung assoziierten Wert und einem mit einer unmittelbar vorausgehenden Tonhöhenmarkierung assoziierten Wert mit einer Anzahl von Werten zwischen dem mit der Tonhöhenmarkierung assoziierten Wert und einem mit einer unmittelbar folgenden Tonhöhenmarkierung assoziierten Wert; Erzeugen der Tonhöhenfrequenzschätzung in Abhängigkeit von der minimalen Anzahl der Werte und der Abtastfrequenz.

Die Teile der Sequenz von Frequenzwerten kann durch Erzeugen von Vielfachen der Tonhöhenfrequenzschätzung ausgewählt werden, wobei die Vielfachen Oberschwingungen der Tonhöhenfrequenzschätzung repräsentieren; und durch Auswählen von Teilen, in denen der Frequenzbereich des Teils im wesentlichen gleich der Hälfte der Tonhöhenfrequenzschätzung ist; und wobei die Mittenfrequenz jedes Teils entweder eine Frequenz ist, die im wesentlichen gleich einem der Vielfachen ist, oder eine Frequenz, die im wesentlichen halb zwischen zwei der Vielfachen liegt.

Die Erfindung liefert außerdem ein Verfahren zum Trainieren eines Qualitätserfassungswerkzeugs mit dem Schritt des Trainierens einer Abbildung zur Verwendung bei einem Verfahren zum Erfassen der Sprachqualität in einem Telekommunikationsnetz dergestalt, daß eine Anpassung zwischen einem aus einer Vielzahl von Parametern für ein Signal erzeugten Qualitätsmaß und dem mit dem Signal assoziierten mittleren Meinungswert durch die Abbildung optimiert wird, wobei die Vielzahl von Parametern einen nach einem der vorhergehenden Ansprüche erzeugten Parameter enthält.

Die Erfindung liefert außerdem ein Verfahren zur Erfassung der Sprachqualität in einem Telekommunikationsnetz, mit den folgenden Schritten: Erzeugen eines Parameters nach einem der vorhergehenden Ansprüche; Erzeugen eines Qualitätsmaßes in Abhängigkeit von dem Parameter.

Es werden nun Ausführungsformen der Erfindung lediglich als Beispiel mit Bezug auf die beigefügten Zeichnungen beschrieben. Es zeigen:

1 eine schematische Darstellung eines nichtintrusiven Qualitätserfassungssystems;

2 eine schematische Darstellung möglicher nichtintrusiver Überwachungspunkte in einem Netzwerk;

3 ein Flußdiagramm des Trainings eines Qualitätserfassungswerkzeugs gemäß der vorliegenden Erfindung;

4a bis 4c die Signalverarbeitung zur Erzeugung eines Parameters gemäß der vorliegenden Erfindung;

5 ein Flußdiagramm der Erzeugung eines Parameters gemäß der vorliegenden Erfindung;

6 ein Flußdiagramm der Funktionsweise eines Erfassungswerkzeugs der vorliegenden Erfindung.

Mit Bezug auf 1 ist ein nicht-intrusives Qualitätserfassungssystem 1 über eine Schnittstelle 3 mit einem Kommunikationskanal 2 verbunden. Die Schnittstelle 3 stellt eine etwaige, zwischen den überwachten Daten und dem Qualitätserfassungssystem 1erforderliche Datenumsetzung bereit. Ein Datensignal wird durch das Qualitätserfassungssystem analysiert und die resultierende Qualitätsvorhersage wird in einer Datenbank 4 gespeichert. Details bezüglich Datensignalen, die analysiert wurden, werden auch zur späteren Bezugnahme gespeichert. Weitere Datensignale werden analysiert und die Qualitätsvorhersage wird so aktualisiert, daß über einen Zeitraum hinweg die Qualitätsvorhersage eine Vielzahl analysierter Datensignale betrifft.

Die Datenbank 4 kann Qualitätsvorhersageergebnisse aus einer Vielzahl verschiedener Abfangpunkte speichern. Die Datenbank 4 kann von einem Benutzer aus der Ferne über ein Benutzerterminal 5 abgefragt werden, das Analyse und Visualisierung der in der Datenbank 4 gespeicherten Qualitätsvorhersageergebnisse bereitstellt.

2 ist ein Blockschaltbild eines beispielhaften Telekommunikationsnetzes, das mögliche Abfangpunkte zeigt, an denen nicht-intrusive Qualitätserfassung verwendet werden kann.

Das in 2 gezeigte Telekommunikationsnetz umfaßt ein Betreibernetz 20, das mit einem Mobilnetz 22 des Typs GSM (globales System für die Mobilkommunikation), einem Mobilnetz 24 der dritten Generation (3G) und einem Netzwerk 26 mit Internet-Protokoll (IP) verbunden ist. Kunden greifen über Hauptverteilungsanlagen 28, 28', die möglicherweise über eine Fernkonzentratoreinheit (RCU) 32 mit einer digitalen Ortsvermittlungsstelle (DLE) 30 verbunden sind, auf das Betreibernetz 20 zu. Verbindungen werden durch digitale Multiplex-Vermittlungseinheiten (DMSU) 34, 34', 34'' geroutet und können über eine internationale Vermittlungsstelle (ISC) 38 zu einem Korrespondentennetz 36 geroutet werden, über ein Voice-Over-IP-Gateway 40 zu dem IP-Netzwerk 26 und über eine Gateway-Mobilvermittlungsstelle (GMSC) 42 zu dem GSM-Netz 22 oder über ein Gateway 44 zu dem 3G-Netz 24. Das IP-Netzwerk 26 umfaßt eine Vielzahl von IP-Routern, von denen ein IP-Router 46 gezeigt ist.

Das GSM-Netz 22 umfaßt eine Vielzahl von Mobilvermittlungsstellen (MSC), von denen eine MSC 48 gezeigt ist, die mit einer Vielzahl von Basis-Sender-Empfängerstationen (BTS) verbunden sind, von denen eine BTS 50 gezeigt ist. Das 3G-Netz 24 umfaßt eine Vielzahl von Knoten, von denen ein Knoten 52 gezeigt ist.

Die nicht-intrusive Qualitätserfassung kann zum Beispiel an den folgenden Punkten durchgeführt werden:

  • • An der DLE 30 können von einer Vermittlung ausgegebene Verbindungen zu einem spezifischen Kunden erfaßt werden.
  • • An den DMSU 34, 34', 34'' können Strecken zwischen DMSU und Verbindungsvorrichtungen mit anderen Betreibern erfaßt werden.
  • • An der ISC 38 kann die internationale Strecke erfaßt werden.
  • • An dem Voice-Over-IP-Gateway 40 kann die Schnittstelle mit einem IP-Netzwerk erfaßt werden.
  • • An der MSC 48 können Verbindungen zu und von dem Mobilnetz erfaßt werden.
  • • An dem IP-Router 46 können Verbindungen zu und von dem IP-Netz erfaßt werden.
  • • An dem Media-Gateway 44 können Verbindungen zu und von dem 3G-Netz erfaßt werden.

Es können vielfältige Prüfregimes und Konfigurationen verwendet werden, um einer bestimmten Anwendung zu genügen, wobei Qualitätsmaße für Verbindungsauswahlen auf der Basis der Anforderungen des Benutzers bereitgestellt werden. Diese wären zum Beispiel verschiedene Prüfablaufplanungen und Routenauswahlen. Mit mehreren Erfassungspunkten in einem Netz ist es auch möglich, Ergebnisse zwischen Erfassungspunkten zu vergleichen. Dies ermöglicht eine Überwachung der Leistungsfähigkeit spezifischer Strecken oder Netzwerksubsysteme. Von Kunden wahrgenommene Reduktionen der Qualität können dann spezifischen Umständen oder Fehlern zugeschrieben werden.

Die in der Datenbank 4 gespeicherten Daten können für eine Anzahl von Anwendungen verwendet werden, wie etwa:

  • • Netzwerkintegritätsprüfungen
  • • Netzwerkoptimierung
  • • Geräteversuche/-kommissionierung
  • • Echtzeit-Routing
  • • Interoperabilitäts-Vereinbarungsüberwachung
  • • Netzwerk-Problembeseitigung
  • • Alarmerzeugung auf Routen
  • • Mobilfunkplanung/-Optimierung

Nunmehr mit Bezug auf 3 wird ein Verfahren zum Trainieren eines nicht-intrusiven Qualitätserfassungssystems gemäß der vorliegenden Erfindung beschrieben. Es versteht sich, daß dieses Verfahren durch Software ausgeführt werden kann, die einen Vielzweckcomputer steuert.

Eine Datenbank 60 enthält verzerrte Sprachproben, die vielfältige Bedingungen und Technologien enthalten. Diese wurden von Gremien menschlicher Zuhörer bewertet, um auf bekannte Weise eine MOS bereitzustellen. Jede Sprachprobe weist deshalb eine aus subjektiven Prüfungen abgeleitete assoziierte MOS auf. Die Datenbank 60 enthält Sprachsignale mit unter anderem den folgenden Netzwerkbedingungen und -beeinträchtigungen: Mobilnetzfehler, Stummschaltungen, Sprach-Kodex mit niedriger Bit-Rate, Rauschen, Transcodierung, Voice-Over-Internet-Protkoll (VoIP), Clipping von Digitalschaltungs-Vervielfachungsgeräten (DCME) – Digital Circuit Multiplication Equipment.

Bei 61 wird jede Probe vorverarbeitet, um den Signalpegel zu normieren und etwaige Filterungseffekte des Netzwerks, über das die Sprachprobe gesammelt wurde, zu berücksichtigen. Die Sprachprobe wird gefiltert, in Bezug auf Pegel ausgerichtet, und ein etwaiges Gleichstrom-Offset wird beseitigt. Der Betrag der angewandten Verstärkung oder Dämpfung wird zur späteren Verwendung gespeichert.

Beim Schritt 62 wird für jede Probe Tondetektion durchgeführt, um zu bestimmen, ob es sich bei der Probe um Sprache oder Daten handelt, oder ob sie DTMF- oder Musiktöne enthält. Wenn bestimmt wird, daß es sich bei der Probe nicht um Sprache handelt, wird die Probe verworfen und nicht zum Training des Qualitätserfassungswerkzeugs verwendet.

In Schritt 63 wird jede Sprachprobe mit Anmerkungen versehen, um Perioden von Sprachaktivität und/oder Stille/Rauschen anzugeben. Man erreicht dies durch Verwendung eines Sprachaktivitätsdetektors (VAD) zusammen mit einem Diskriminator für stimmhafte/nicht stimmhafte Sprache.

In Schritt 64 wird jede Sprachprobe mit Anmerkungen versehen, um Positionen der Tonhöhenzyklen unter Verwendung eines zeitlichen/spektralen Tonhöhenextraktionsverfahrens anzugeben. Dies ermöglicht die Extraktion von Parametern auf tonhöhensynchrone Weise, was dabei hilft, Parameter bereitzustellen, die von dem konkreten Speicher unabhängig sind. Als Teil der später beschriebenen Sprachparameterisierung werden Deskriptoren des Rachen-Mundhohlraums extrahiert und werden den stimmhaften Abschnitten der Sprachdatei entnommen. Eine Endtonhöhenzykluskennung dient zur Bereitstellung von Grenzen für diese Extraktion. Außerdem wird eine Charakterisierung der Eigenschaften der Tonhöhenstruktur über die Zeit hinweg an den Schritt 65 geleitet, um Teil der Sprachparameter zu bilden.

Der Parameterisierungsschritt 65 ist dazu ausgelegt, die zu verarbeitende Datenmenge zu reduzieren, während die für die in der Sprachprobe anwesenden Verzerrungen relevanten Informationen erhalten werden.

Bei dieser Ausführungsform der Erfindung werden über 300 in Frage kommende Parameter berechnet, darunter die folgenden:

  • • Rauschpegel
  • • Signal/Rausch-Verhältnis
  • • mittlere Tonhöhe des Sprechers
  • • Tonhöhenschwankungsdeskriptoren
  • • Längenschwankungen
  • • Inhaltsschwankungen von Rahmen zu Rahmen
  • • Momentan-Pegelfluktuationen

Deskriptoren des Rachen-Mundhohlraums:

Zusätzlich zu dem obigen werden verschiedene Beschreibungen der Parameter des Rachen-Mundhohlraums berechnet. Sie erfassen die Gesamtpassung des Modells des Rachen-Mundhohlraums, unwahrscheinliche Momentanschwankungen und illegale Sequenzen. Außerdem werden Mittelwerte und Statistiken für individuelle Modellelemente des Rachen-Mundhohlraums über die Zeit hinweg als Basisparameter aufgenommen. Siehe zum Beispiel die Internationale Patentanmeldung Nr. WO 01/35393.

Außerdem kann eine Verzerrungsidentifikation durchgeführt werden. Dies wird hier nicht beschrieben, da es für die vorliegende Erfindung nicht relevant ist. Eine volle Beschreibung findet sich in der gleichzeitig anhängigen Europäischen Patentanmeldung Nr. 03250333.6, veröffentlicht als EP-A-1443496.

Die Erfinder haben vor kurzem einen neuen Parameter der spektralen Klarheit erfunden, der die Leistungsfähigkeit des Sprachqualitätserfassungsverfahrens signifikant verbessert.

Die Erzeugung dieses Parameters aus den Teilen des Signals, die in Schritt 63 als stimmhaft markiert wurden, wird nun mit Bezug auf 4a–c und 5 beschrieben.

Im Schritt 100 wird ein Abschnitt eines Signals, wie zum Beispiel der in 4a gezeigte, ausgewählt. Das Signal umfaßt eine Sequenz von Werten, die mit einer bestimmten Abtastfrequenz gemessen wurden. Bei dieser Ausführungsform der Erfindung wird das Signal mit einer Frequenz von 8000Hz abgetastet. 4b repräsentiert eine Frequenz von Tonhöhenmarkierungen, die zuvor extrahiert und mit dem Signal assoziiert wurden. Es wird ein Abschnitt mit 512 Werten dergestalt ausgewählt, daß ein mit einer Tonhöhenmarkierung P assoziierter Wert in der Mitte des gewählten Abschnitts liegt. Dann wird ein Blackman-Harris-Fenster auf den Teil angewandt und im Schritt 102 eine schnelle Fouriertransformation angewandt, um, wie schematisch in 4c dargestellt, eine Sequenz von Frequenzwerten zu produzieren. Es versteht sich, daß genausogut andere Frequenztransformationen verwendet werden könnten, wie zum Beispiel eine diskrete Fouriertransformation (DFT).

Es wird der Logarithmus jedes Frequenzwerts berechnet, um einen Wert bereitzustellen, der von dem Pegel (Mittelwert) des ursprünglichen Signals unabhängig ist. Im Schritt 104 wird folgendermaßen eine Frequenzschätzung erzeugt. Die Anzahl der Werte zwischen der Tonhöhenmarkierung P und der Tonhöhenmarkierung P + 1 wird mit der Anzahl von Werten zwischen der Tonhöhenmarkierung P und der Tonhöhenmarkierung P – 1 verglichen. In diesem Beispiel betragen die Differenzen 80 bzw. 81 Werte. Es wird das Minimum ausgewählt und die Tonhöhenfrequenz abhängig von der Abtastfrequenz berechnet. In diesem Beispiel beträgt die Tonhöhenfrequenzschätzung deshalb 100Hz. Die Tonhöhenfrequenzschätzung repräsentiert die Tonhöhe der Sprache und wird durch H0 repräsentiert.

In Schritt 106 werden Teile der Sequenz von Frequenzwerten abhängig von der Tonhöhenfrequenzschätzung folgendermaßen ausgewählt. Es wird geschätzt, daß Oberschwingungen (H1–H5) um Vielfache der Tonhöhenfrequenzschätzung H0 herum auftreten, so daß man in diesem Beispiel erwarten würde, daß H1 um 200Hz, H2 um 300Hz usw. liegt. Diese sind in 4c schematisch dargestellt. Es wäre möglich, durch Durchführen eines "peak pickings" um den erwarteten Frequenzwert der Oberschwingungen herum eine genauere Oberschwingungsfrequenz zu berechnen.

Teile mit einem Frequenzbereich von der Hälfte der Tonhöhenfrequenzschätzung werden gewählt, obwohl auch andere kürzere Frequenzbereiche verwendet werden könnten. Die Mittenfrequenz der gewählten Teile ist entweder gleich einem Frequenzwert einer Oberschwingung oder einem Frequenzwert auf halbem Weg zwischen zwei Oberschwingungen. Gewählte Teile A, B, C, D, E, F, G sind in 4c dargestellt. Man beachte, daß, wenn der Frequenzbereich eines Teils gleich der Hälfte des Frequenzbereichs der Tonhöhenfrequenzschätzung verwendet wird, kein Platz zwischen nachfolgenden gewählten Teilen besteht.

Im Schritt 108 wird dann ein Mittelwert für jeden Teil berechnet, indem man einfach die Sequenz von Werten in jedem Teil summiert und die Gesamtsumme durch die Anzahl der Werte in dem Teil dividiert.

Im Schritt 110 wird schließlich die Summe der Differenzen zwischen zwei angrenzenden Teilen berechnet und ein Mittelwert über die Anzahl der verwendeten Spitzen erzeugt. Bei dieser Ausführungsform der Erfindung sind die zur Erzeugung des Parameters verwendeten Differenzen diejenigen, die mit den Teilen assoziiert sind, die H2 bis H5 und den nachfolgenden Teil in jedem Fall betreffen. Der Grund dafür besteht darin, daß H1 im allgemeinen wegen der Telefonbandbreite herausgefiltert wird.

Für jede Tonhöhenmarkierung wird somit ein Parameter erzeugt, und um einen Parameter für den gesamten stimmhaften Teil des Signals zu erzeugen, wird ein einfacher Mittelwert erzeugt.

Nachdem alle Parameter berechnet wurden, einschließlich des oben beschriebenen neuen Parameters, wird die Abbildung 76 bei 68 trainiert. Sobald die optimale Abbildung zwischen den Parametern für jede Sprachprobe und die (durch die Datenbank 60 bereitgestellte) mit jeder Sprachprobe assoziierte MOS bestimmt wurden, wird in Schritt 69 eine Charakterisierung der Abbildung abgespeichert, wozu die Identifikation der bestimmten Parameter gehört, die zu der optimalen Abbildung geführt haben.

Bei dieser Ausführungsform ist die Abbildung eine Linearabbildung zwischen den gewählten Parametern und MOS, und die optimale Abbildung wird unter Verwendung einer Analyse der linearen Regression bestimmt, so daß, nachdem die Abbildung im Schritt 68 trainiert wurde, die Abbildung 76 durch eine Menge von Parametern charakterisiert ist, die zusammen mit einem Gewicht für jeden Parameter benutzt werden.

Die Funktionsweise des nicht-intrusiven Qualitätserfassungswerkzeugs, nachdem das Training abgeschlossen wurde, wird nun mit Bezug auf 6 beschrieben.

Die Schritte für den Betrieb des Qualitätserfassungswerkzeugs sind den in 3 gezeigten Schritten ähnlich, die während des Trainings der Gesamtabbildung für das Qualitätserfassungswerkzeug durchgeführt werden.

Die Schritte 6164 funktionieren wie mit Bezug auf 3 beschrieben. In diesem Fall wird nur eine Probe auf einmal verarbeitet. In Schritt 75 werden die zuvor abgespeicherten Abbildungscharakteristika 76 zur Bestimmung einer MOS für die Probe verwendet.

Für Fachleute ist erkennbar, daß die oben beschriebenen Verfahren auf einem herkömmlichen programmierbaren Computer implementiert werden können, und daß ein Computerprogramm, das Anweisungen zur Steuerung des programmierbaren Computers zur Ausführung der obigen Verfahren auf einem computerlesbaren Medium bereitgestellt werden kann.

Es versteht sich, daß, obwohl der obige Prozeß mit spezifischer Bezugnahme auf Sprachsignale beschrieben wurde, die Prozesse gleichermaßen auf andere Arten von Signalen, zum Beispiel auf Videosignale, anwendbar sind.


Anspruch[de]
Verfahren zum Erzeugen eines Parameters aus einem Signal mit einer Sequenz von Werten, die mit einer Abtastfrequenz aus stimmhaften Teilen des Signals gemessen werden, wobei der Parameter für die Verwendung in einem Qualitätserfassungswerkzeug geeignet ist, wobei das Verfahren die folgenden Schritte umfaßt:

a) Auswählen (100) eines Abschnitts des Signals;

b) Ausführen (102) einer Frequenztransformation an dem Abschnitt, um eine Sequenz von Frequenzwerten bereitzustellen; und

c) Erzeugen (104) einer Tonhöhenfrequenzschätzung;

dadurch gekennzeichnet, daß das Verfahren ferner die folgenden Schritte umfaßt:

d) Auswählen (106) einer Vielzahl von Teilen der Sequenz von Frequenzwerten in Abhängigkeit von der Tonhöhenfrequenzschätzung, wobei die Teile einen Frequenzbereich und eine Mittenfrequenz aufweisen;

e) Erzeugen (108) eines Mittelwerts für jeden der Vielzahl von Teilen durch Summieren der Sequenz von Werten jedes Teils und Dividieren des Gesamtwerts durch die Anzahl der Werte in dem Teil;

f) Erzeugen (110) eines Abschnittsparameters in Abhängigkeit von der Differenz zwischen dem Mittelwert für einen Teil der Sequenz von Frequenzwerten und dem Mittelwert für einen nachfolgenden Teil der Sequenz von Frequenzwerten;

g) Wiederholen der Schritte a)–f), um eine Vielzahl der Abschnittsparameter bereitzustellen, und Erzeugen der Parameter durch eine Schätzung in Abhängigkeit von der Vielzahl der Abschnittsparameter.
Verfahren nach Anspruch 1, bei dem der Abschnitt der Sequenz von Werten so ausgewählt wird, daß eine Tonhöhenmarkierung mit einem Wert in der Mitte des Abschnitts assoziiert wird. Verfahren nach Anspruch 1 oder Anspruch 2, bei dem die Frequenztransformation eine schnelle Fouriertransformation umfaßt. Verfahren nach einem der vorhergehenden Ansprüche, bei dem der Schritt des Erzeugens einer Tonhöhenfrequenzschätzung die folgenden Schritte umfaßt:

Verwenden der mit der Sequenz von Werten assoziierten Tonhöhenmarkierungen;

Vergleichen der Anzahl von Werten zwischen einem mit einer Tonhöhenmarkierung assoziierten Wert und einem mit einer unmittelbar vorausgehenden Tonhöhenmarkierung assoziierten Wert mit einer Anzahl von Werten zwischen dem mit der Tonhöhenmarkierung assoziierten Wert und einem mit einer unmittelbar folgenden Tonhöhenmarkierung assoziierten Wert;

Erzeugen der Tonhöhenfrequenzschätzung in Abhängigkeit von der minimalen Anzahl der Werte und der Abtastfrequenz.
Verfahren nach einem der vorhergehenden Ansprüche, bei dem die Teile der Sequenz von Frequenzwerten durch die folgenden Schritte ausgewählt werden:

Erzeugen von Vielfachen der Tonhöhenfrequenzschätzung, wobei die Vielfachen Oberschwingungen der Tonhöhenfrequenzschätzung repräsentieren; und

Auswählen von Teilen, in denen der Frequenzbereich des Teils im wesentlichen gleich der Hälfte der Tonhöhenfrequenzschätzung ist; und wobei die Mittenfrequenz jedes Teils entweder eine Frequenz ist, die im wesentlichen gleich einem der Vielfachen ist, oder eine Frequenz, die im wesentlichen halb zwischen zwei der Vielfachen liegt.
Verfahren zum Trainieren eines Qualitätserfassungswerkzeugs mit dem Schritt des Trainierens (68) einer Abbildung zur Verwendung bei einem Verfahren zum Erfassen der Sprachqualität in einem Telekommunikationsnetz dergestalt, daß eine Anpassung zwischen einem aus einer Vielzahl von Parametern für ein Signal erzeugten Qualitätsmaß und dem mit dem Signal assoziierten mittleren Meinungswert durch die Abbildung optimiert wird, wobei die Vielzahl von Parametern einen nach einem der vorhergehenden Ansprüche erzeugten Parameter enthält. Verfahren zum Erfassen von Sprachqualität in einem Telekommunikationsnetz, mit den folgenden Schritten:

Erzeugen eines Parameters nach einem der vorhergehenden Ansprüche;

Erzeugen (75) eines Qualitätsmaßes in Abhängigkeit von dem Parameter.
Computerlesbares Medium, das ein Computerprogramm zum Implementieren eines Verfahrens nach einem der Ansprüche 1 bis 7 trägt. Computerprogramm, das Computerprogrammcodemittel umfaßt, die, wenn sie ausgeführt werden, bewirken, daß ein Computer ein Verfahren nach einem der Ansprüche 1 bis 7 durchführt.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com