PatentDe  


Dokumentenidentifikation DE69719014T2 02.10.2003
EP-Veröffentlichungsnummer 0882277
Titel VERFAHREN ZUM KODIEREN MIT BEREICHSINFORMATION
Anmelder Thomson multimedia, Boulogne, FR
Erfinder GUILLOTEL, Philippe, F-92648 Boulogne Cedex, FR
Vertreter Wördemann, H., Dipl.-Ing., Pat.-Anw., 31787 Hameln
DE-Aktenzeichen 69719014
Vertragsstaaten DE, FR, GB, IT
Sprache des Dokument FR
EP-Anmeldetag 24.11.1997
EP-Aktenzeichen 979471299
WO-Anmeldetag 24.11.1997
PCT-Aktenzeichen PCT/FR97/02119
WO-Veröffentlichungsnummer 0098024062
WO-Veröffentlichungsdatum 04.06.1998
EP-Offenlegungsdatum 09.12.1998
EP date of grant 12.02.2003
Veröffentlichungstag im Patentblatt 02.10.2003
IPC-Hauptklasse G06T 9/00

Beschreibung[de]

Die Erfindung betrifft ein Verfahren zur Kodierung von digitalen Videodaten für eine Komprimierung dieser Daten und für eine Übertragung von Bereichsinformationen für kodierte Videobilder. Sie betrifft außerdem eine Vorrichtung zur Durchführung dieses Verfahrens.

Die Lösungen zur Komprimierung von Videodaten sind bekannt und zum Beispiel beschrieben in der MPEG2-Norm und in Le Gall "The MPEG video compression algorithm", Signal Processing Image Communication, Band 4, Nr. 2, 01. April 1992, Amsterdam, Seiten 129-140. Diese Lösungen verwenden jedoch keine Daten für die Segmentierung des Bildes, zum Beispiel für Bereichsinformationen. Die zusätzlichen zu übertragenden Informationen benötigen eine Übertragung mit höheren Kosten für eine bestimmte Bildqualität, ansonsten machen sie die Kodierung mit der Norm inkompatibel.

Der Zweck der vorliegenden Erfindung besteht darin, die oben genannten Nachteile zu vermeiden.

Zu diesem Zweck betrifft die Erfindung ein Verfahren zur Komprimierung von digitalen Daten eines Videobildes, das eine Zerlegung des Bildes in Bildblöcke, eine diskrete Cosinustransformation dieser Blöcke zur Lieferung von Koeffizienten und eine Quantisierung jedes Koeffizienten aus einem Quantisierschritt bewirkt, dadurch gekennzeichnet, dass es außerdem eine Segmentierung des Bildes und eine Etikettierung der erhaltenen Bereiche durchführt und dass es jedem Block einen Block- Regelschritt zuordnet, auf dessen Basis das Quantisierintervall für jeden Koeffizienten des Blocks definiert wird, dessen Wert in Abhängigkeit von diesen Etiketten berechnet wird.

Gegenstand der Erfindung ist außerdem eine Vorrichtung zur Komprimierung von digitalen Daten eines Videobildes für die Durchführung des Verfahrens mit einer Schaltung zur Zerlegung des Bildes in Bildblöcke, einer Schaltung zur diskreten Cosinustransformation, die eine derartige Transformation des Bildblocks in Blöcke von Koeffizienten bewirkt, einer Quantisierschaltung zur Quantisierung der Koeffizienten, die zu dem aus einem Regelschritt transformierten Block gehören, einer Regelschaltung, die einen Regelschritt eines Bildes in Abhängigkeit von einem Datenraten- Einstellwert am Ausgang der Vorrichtung berechnet, gekennzeichnet durch eine Segmentierschaltung zur Definition der Objekte in dem Bild, zur Etikettierung dieser Objekte und zur Zuordnung einer entsprechenden Etikette zu jedem der Bildblöcke, um diese Etiketten zu der Quantisierschaltung zu liefern, wobei die Quantisierschaltung vor der Auswertung den Regelschritt in Abhängigkeit von der Etikette ändert, um einen Schritt des Regelblocks für jeden Bildblock zu liefern.

Gegenstand der Erfindung ist außerdem eine Vorrichtung zur Dekomprimierung von Videodaten zum Empfang der komprimierten Daten nach dem Verfahren von Anspruch 1, wobei Videodaten für die Bildblöcke zu verschiedenen Bereichen des Bildes und zu dem bei jedem Block beeinflußten Regelschritt gehören, mit einer Schaltung zur Dequantisierung der Koeffizienten, die zu einem Bildblock gehören, einer Schaltung zur inversen diskreten Cosinustransformation, die eine derartige inverse Transformation des dequantisierten Bildblocks bewirkt, gekennzeichnet durch Mittel zur Bestimmung des Bereichs, zu dem der Block aus dem für diesen Block empfangenen Regelschritt gehört.

Somit werden die Bereichsinformationen durch die Informationen für den Regelschritt "getragen".

Aufgrund der Erfindung können die Bereichsinformationen nahezu ohne Verschlechterung der Qualität des Bildes für eine bestimmte Übertragungs-Bitrate übertragen werden. Der Kodiervorgang bleibt kompatibel mit der MPEG-Norm, wenn letztere angewendet wird.

Weitere Merkmale und Vorteile der Erfindung ergeben sich deutlicher aus der folgenden Beschreibung an einem nicht-einschränkenden Ausführungsbeispiel im Zusammenhang mit der beigefügten Fig. 1, die eine Vorrichtung gemäß der Erfindung zeigt.

Die in Fig. 1 beschriebene Vorrichtung wird im folgenden erläutert.

Die digitalen Daten des Videobildes werden zu dem Eingang der Vorrichtung übertragen. Dieser Eingang ist gleichzeitig mit dem Eingang einer Bildspeicherschaltung 1, die außerdem die zeitliche Reihenfolge der Bilder ändert, und mit einer Schaltung 2 zur Segmentierung in Bereiche verbunden. Der Ausgang der Bildspeicherschaltung ist mit dem Eingang einer Voranalyse-Schaltung 3, mit dem Eingang einer Schaltung 4 zur Zerlegung in Bildblöcke und mit dem Eingang einer Schaltung 5 zur Bewegungsschätzung verbunden. Der Ausgang der Zerlegungsschaltung ist mit einem ersten Eingang eines Subtrahierers 6 und mit einem ersten Eingang einer Wahlschaltung 7 verbunden. Der zweite Eingang des Subtrahierers stammt von einer Schaltung 8 zur Bildvoraussage.

Der Ausgang des Subtrahierers 6 ist mit einem zweiten Eingang der Wahlschaltung 7 verbunden. Der Ausgang dieser Schaltung ist mit einer Berechnungsschaltung 9 für eine diskrete Cosinustransformation oder TCD verbunden. Die gewonnenen Koeffizieten werden einem ersten Eingang einer Quantisierschaltung 10 zugeführt, und der Ausgang dieser Quantisierschaltung ist mit dem Ausgang der Vorrichtung über eine Kodierschaltung 11 mit variabler Länge, oder CLV, verbunden. Der Ausgang der Voranalyse-Schaltung 3 ist mit einem zweiten Eingang der Quantisierschaltung 10 verbunden. Der Ausgang der Segmentierschaltung 2 ist mit einem dritten Eingang der Quantisierschaltung 10 verbunden.

Der Ausgang der Quantisierschaltung ist außerdem mit einem zweiten Eingang des Bewegungsschätzers über, aufeinanderfolgend, eine inverse Quantisierschaltung 12, eine Berechnungsschaltung 13 für eine inverse diskrete Cosinustransformation und einen in Reihe geschalteten Speicher 14 verbunden. Der Ausgang dieses Speichers ist außerdem mit einem ersten Eingang der Voraussageschaltung 8 verbunden. Der Ausgang des Bewegungsschätzers 5 ist mit einem zweiten Eingang der Voraussageschaltung 8 verbunden.

Schließlich ist der Ausgang der Dekodierschaltung CLV 11 mit einem vierten Eingang der Quantisierschaltung 10 über eine Regelschaltung 15 verbunden.

Der Eingang der Vorrichtung empfängt die digitalen Videodaten, zum Beispiel im Format 4 : 2 : 0. Diese Daten werden in Form von Gruppen von Bildern in dem Speicher 1 gespeichert, der außerdem diese Bilder in eine bestimmte Reihenfolge bringt. Jedes Bild wird durch die Zerlegungsschaltung 4 in Bildblöcke zerlegt, die nacheinander jeden laufenden Bildblock dem Eingang der Wahlschaltung 7 zuführt.

Die Schaltung 8 zur Bildvoraussage hat die Aufgabe, ein vorausgesagtes Bild aus einem vorangehenden, rekonstruierten Bild zu berechnen, das von dem Speicher 14 und von Bewegungsvektoren stammt, die durch den Bewegungsschätzer 5 übertragen werden. Der vorausgesagte Block, der dem laufenden Block entspricht, wird dann zu einem Eingang des Subtrahierers übertragen und von dem laufendem Block an dem anderen Eingang subtrahiert, um am Ausgang des Subtrahierers einen Blockfehler oder Restanteile zu liefern. Die Wahlschaltung 7 wählt aus dem Fehlerblock oder dem laufenden Block denjenigen mit der geringsten Energie. Wenn der laufende Block gewählt wird, handelt es sich um eine Intra-Kodierung des Blocks. Wenn der Fehlerblock gewählt wird, handelt es sich um eine Inter-Kodierung. Es können natürlich mehrere Typen einer Inter-Kodierung bestehen, die hier nicht beschrieben werden, zum Beispiel diejenigen, die in der MPEG2-Norm festgelegt sind. Die Wahl der Kodierung beinhaltet somit gleichzeitig diese Typen der Inter- Kodierung. Der gewählte Block unterliegt einer diskreten Cosinustransformation durch die Berechnungsschaltung 9 für die diskrete Cosinustransformation, bevor er zu der Quantisierschaltung 10 übertragen wird. Die Koeffizienten werden dann mit einem realen Quantisierschritt aus einer Wichtungsmatrix quantisiert, der ein gewichteter Quantisierschritt des Blockes ist, und unterliegen dann einer Zickzack- Abtastung und werden dann der CLV-Schaltung 11 zugeführt, die eine Kodierung mit variabler Länge bewirkt, bevor sie am Ausgang der Vorrichtung verfügbar sind.

Die durch die Quantisierschaltung 10 bewirkte Quantisierung ist abhängig von dem Einstellwert der Bitrate am Ausgang der Vorrichtung. Eine Regelschleife enthält eine Regelschaltung 15, die eine Regelung der Bitrate am Ausgang ermöglicht. Diese Bitrate wird vom Ausgang des Koders CLV abgenommen und einer Regelschaltung zugeführt, die in Abhängigkeit von der gemessenen Bitrate und dem Einstellwert der Bitrate einen Regelschritt berechnet, wie später erläutert, aus dem die Quantisierschritte berechnet werden.

Die Voranalyse-Schaltung 3 bewirkt eine Voranalyse des Bildes, das heißt berechnet die Bitrate des zu kodierenden Bildes für einen Quantisierschritt, der aus den vorangehenden Kodierungen ermittelt wird. Daraus wird ein Quantisierschritt des Bildes abgeleitet, der gegebenenfalls durch die Regelschleife korrigiert wird.

Die quantisierten Koeffizienten des laufenden Blocks, die am Ausgang der Quantisierschaltung 10 verfügbar sind, werden zu einer inversen Quantisierschaltung übertragen, die diese Koeffizienten rekonstruiert, und dann einer Schaltung zur inversen diskreten Cosinustransformation zuführt, die die Blöcke des laufenden Bildes rekonstruiert. Die Blöcke werden in dem Speicher 14 gespeichert, der an seinem Ausgang das rekonstruierte oder rekonstituierte Bild liefert. Der Bewegungsschätzer 5 vergleicht den an einem Eingang empfangenen laufenden Block mit einem auf dem anderen Eingang empfangenen rekonstituierten Bild, um daraus einen Bewegungsvektor abzuleiten, der zu diesem Block gehört und zu der Bildvoraussage-Schaltung 8 übertragen wird. Diese überträgt einen vorausgesagten Block zu dem Subtrahierer, das ist der rekonstruierte Bildblock, verschoben durch den Bewegungsvektor relativ zu dem verarbeiteten laufenden Block.

Die digitalen Videodaten am Eingang der Vorrichtung werden außerdem einer Segmentierschaltung 2 zugeführt. Diese Schaltung hat die Aufgabe, in dem Bild Zonen oder Bereiche zu definieren, die bestimmte Kriterien erfüllen, zum Beispiel Gleichmäßigkeits- oder Bewegungskriterien. Eine grundsätzliche Segmentierung besteht zum Beispiel in der Identifizierung eines Objektes gegenüber einem gleichmäßigen Hintergrund.

Eine Matrix von Koeffizienten, die eine Bereichszahl oder ein Etikett jedem Bildblock in Abhängigkeit von dem Bereich zuordnen, zu dem dieser Block gehört, wird dann zu der Quantisierschaltung übertragen.

Die Segmentierschaltung kann diese Segmentierung auf der Basis einer Bewegungsschätzung durchführen. Das Bewegungsvektorfeld und die Luminanzgradienten machen es möglich, die Bereiche auf der Basis der gleichmäßigen Zonen (homogene Bewegungen) und ihrer Begrenzungen (Gradienten) zu definieren. In diesem Fall können die durch die Schaltung berechneten Bewegungsvektoren zu der Bildvoraussageschaltung übertragen werden, gegebenenfalls nachdem diese Vektoren geformt wurden (z. B. eine Umsetzung des Pixel/Block-Typ, wenn die Bewegungsschätzung beim Pixel erfolgt), so dass der Bewegungsschätzer 5 nicht mehr benötigt wird.

Die Segmentierschaltung bewirkt außerdem eine Speicherung und eine Neuordnung der Bilder von dem Typ derjenigen, die für die Bildspeicherschaltung 1 ausgeführt werden, um die Informationen in einer synchronen Weise an ihrem Ausgang zu liefern.

Die Kodiervorrichtung überträgt in der Praxis gemäß der MPEG-Norm keinen Quantisieschritt, sondern einen Regelschritt, der in der Norm unter der englischen Bezeichnung Quant_Scale_Code bekannt ist.

Genauer gesagt, sie überträgt diesen Schritt zusammen mit jedem Makroblock, der aus mehreren Bildblöcken besteht, wobei alle oben beschriebenen Vorgänge in der MPEG-Norm auf Makroblöcken und nicht auf Bildblöcken erfolgen. Die folgenden Überlegungen beziehen sich ebenso auf Makroblöcke oder Bildblöcke.

Mit jedem Makroblock von Intra-Koeffizienten oder von Restanteilen werden unter anderem und nach der Kodierung mit variabler Länge durch die Schaltung 11 der Wert eines Regelschritts, der durch die Quantisiersschaltung berechnet wird, und der Wert des Bewegungsvektors, der, sofern notwendig, durch den Bewegungsschätzer geliefert wird (Verknüpfung zwischen dem Bewegungsschätzer und der Kodierschaltung, die außerdem das in Fig. 1 nicht dargestellte Multiplexing bewirkt), übertragen. Im Intra-Modus ist dieser Bewegungsvektor nicht erforderlich.

In einem Beispiel ist der Quantisierschritt qr(i, j), der effektiv einem Koeffizienten mit dem Index i, j zugeführt wird, entsprechend der Reihe i und der Spalte j in dem Block von Koeffizienten, mit dem Regelschritt q des Blocks durch folgende Gleichung verknüpft.

v(i, j) ist ein Wichtungskoeffizient der Wichtungsmatrix, der auf die Koeffizienten vor ihrer Quantisierung angewendet wird.

f(q) ist ein lineares oder ein nichtlineares Gesetz, das den Regelschritt q mit dem auf den Block angewendeten Block-Quantisierschritt f(q) verknüpft.

Allgemeiner ist der Regelschritt, der auch als Blockregelung bezeichnet wird, wie die übertragenen Parameter durch die Einheit zur Komprimierung für jeden Block oder Makroblock definiert, dessen Wert abhängig ist von dem tatsächlichen, auf die Koeffizienten des Blocks oder des Makroblocks angewendeten Wert.

Die Matrix von Etiketten, die durch die Segmentierschaltung übertragen wird, wirkt direkt auf den Regelschritt, der in bekannter Weise aus der Regelschaltung berechnet wird, um ihn zu modifizieren. Es ist der entsprechende modifizierte Quantisierschritt, der effektiv für die Durchführung der Quantisierung der Koeffizienten benutzt wird, wobei der modifizierte Regelschritt (Schritt der Blockregelung) mit den komprimierten Daten zu dem Dekoder übertragen wird und somit die Bereichsinformationen "transportiert".

Zur Durchführung dieser Modifikation ist jedem Bereich ein Inkrementier- oder Dekrementier-Schritt zugeordnet, ein anderer Wert für jeden Bereich, der dann auf den Wert des Regelschritts angewendet wird, der durch die Regelschaltung berechnet wird. Die Werte werden ebenfalls durch diese Schaltung um den Wert des Regelschritts aufgeteilt, der durch die Schaltung derart berechnet wird, dass ein mittlerer Wert gleich oder nahe demjenigen konserviert wird, um eine Störung dieser Regelung zu vermeiden.

Wenn zum Beispiel der berechnete Wert des Regelschritts 20 beträgt und wenn die Anzahl der zu übertragenen Bereiche 5 beträgt, ist es möglich, die Koeffizienten eines Makroblocks mit einem Schritt der Blockregelung (der ein ganzzahliger Wert ist) zwischen 18 und 22 zu quantisieren, abhängig von dem Bereich, zu dem er gehört.

Der Einfluß dieser Modifikation auf den Quantisierschritt ist gering und ist weniger groß auf die niederfrequenten Koeffizienten, die mit einem geringeren Quantisierschritt kodiert werden als ihre hochfrequenten Koeffizienten.

Bei einer Wirkungsweise vom Typ VBR, im englischen "Variable Bit Rate", für den die Bitrate am Ausgang der Vorrichtung sich im Laufe der Zeit ändern kann, ist die Modifikation des Quantisierschritts und demzufolge der Bitrate nicht störend.

Bei einem Betrieb vom Typ CBR (Constant Bit Rate), für den eine konstante Bitrate gesucht wird, adaptiert der Regelvorgang im allgemeinen den Quantisierschritt der letzten Streifen des Bildes oder der "slices" (Scheiben) in der englischen Sprache der MPEG-Norm, in Abhängigkeit von der für die vorangehenden Streifen gemessenen Bitrate und der Einstellwert-Bitrate in einer solchen Weise, dass eine bessere Annäherung an diese Einstellwert-Bitrate erreicht wird. Die Bereichsinformationen gehen dann verloren, und dieser Regelvorgang wird daher innerhalb eines Bildes gesperrt. Die Regelung erfolgt dann bei dem Wert des Bildes und nicht mehr bei den Streifen. Einfach ausgedrückt: Die Geschwindigkeit der Regelung bei der Einstellpunkt-Bitrate, oder die Ansprechzeit ist langsamer, und die vorübergehende Bitrate ist weniger konstant.

Es ist auch möglich, Rückfallmodi zu definieren, um eine Garantie gegen eine Fehlfunktion zu bilden. Zum Beispiel eine Rückkehr zu einer konventionellen Regelung je Streifen, wenn der Puffer sich in der Gefahr eines Leerwerdens oder Austrocknens oder eines Überlaufens befindet. Die Tatsache, dass der Block-Regelungsschritt je Streifen konstant wird, während er sich bei jedem Block in Abhängigkeit von dem Bereich ändert, dem Dekoder die Änderung der Betriebsweise anzeigt, wobei diese Änderung transparent ist für einen konventionellen Dekoder, der die MPEG-Norm anwendet. Die Bereichsinformationen könnten dann rekonstruiert werden, zum Beispiel aus der Korrelation über das Bild oder mit den vorangehenden Bildern oder einfacher mit denjenigen, die im Alarmfall nicht verfügbar sind.

Eine Verbesserung der Vorrichtung gemäß der Erfindung wird im folgenden beschrieben.

Wieder zu dem Diagramm der Fig. 1, wo die Modifikation in punktierten Linien dargestellt ist: Ein zweiter Ausgang der Voranalyse-Schaltung 3 ist mit dem Eingang einer Schaltung zur Berechnung der räumlichen Einstellkoeffizienten 16 verbunden. Der Ausgang dieser Schaltung ist mit einem fünften Eingang der Quantisierschaltung 10 verbunden.

Der Zweck dieser Schaltung besteht darin, für jeden Makroblock einen Koeffizienten zu berechnen, der die räumlichen Eigenschaften des Bildes wiedergibt, nämlich zur Bestimmung der Makroblöcke, für die das Auge gegenüber Fehlern empfindlicher ist als für die anderen.

Zum Beispiel ist für die Makroblöcke, die zu einem stark strukturierten Bereich des Bildes gehören, der Wert des Koeffizienten nahezu 1, wobei dieser Wert abnimmt, wenn der Bereich, zu dem er gehört, gleichmäßiger wird. Diese Koeffizienten werden aus der Berechnung der Energie oder der Kosten der Kodierung des Makroblocks abgeleitet, die bei der Voranalyse des Bildes erfolgt. Die Makroblöcke, die zu ungleichmäßigen Bereichen gehören, besitzen eine geringere Energie als diejenigen, die zu strukturierten Bereichen und somit kleineren Koeffizienten gehören, werden ihnen zugeordnet.

Ein weiteres angewendetes Kriterium verwendet die zeitlichen Informationen, die in den Verschiebungs- oder Bewegungsvektoren enthalten sind. Für einen Bereich, der sich langsamer bewegt als der größte Teil der Szene, ist der Koeffizient kleiner als für den übrigen Teil des Bildes. Daher werden diese Bereiche bevorzugt.

Diese Kriterien können auch manuell definiert werden, indem der Benutzer bestimmte Bereiche des Bildes definiert, die er bevorzugen möchte. Es handelt sich daher um eine subjektive Qualitätsteuerung, die durch den Operateur vorgenommen wird.

Eine Matrix von räumlichen Koeffizienten, die jedem Makroblock einen Koeffizienten zuordnet und als Korrekturmaske bezeichnet wird, wird somit durch diese Schaltung für jedes Bild berechnet, um die räumlichen Koeffizienten zu berechnen, und wird zu der Quantisierschaltung 10 übertragen.

Letztere bewirkt dann auf der Grundlage der Matrix der durch die Segmentierschaltung 2 gelieferten Bereichsziffern eine Mittelwertbildung der räumlichen Koeffizienten je Bereich, so dass derselbe Koeffizient je Bereich gewonnen wird.

Die Quantisierschaltung bewirkt in dieser Variante, anstelle der Vorgänge der Inkrementierung und Dekrementierung, einen Multiplikationsvorgang der Quantisierschritte, die in konventioneller Weise gewonnen werden, durch diese gemittelten Koeffizienten und dann eine Abrundung des berechneten Wertes des Regelschritts für die Bestimmung eines neuen, ganzzahligen Regelschritts. Wenn die Mittelung des räumlichen Koeffizienten (man kann identische Werte finden) oder diese Abrundung zu zwei identischen Regelschritten für die verschiedenen Bereiche führt, wird dann der nächstbenachbarte ganzzahlige Wert gewählt, um diese Identität zu beseitigen.

Auf diese Weise erfolgt die Modifikation des Regelschritts (oder des Quantisierschritts) nicht mehr zufallsmäßig in Abhängigkeit von den Etiketten der Bereiche, sondern durch Berücksichtigung der räumlichen und zeitlichen Eigenschaften des Bildes, wodurch die Qualität des Bildes für dieselbe Bitrate verbessert wird.

Zum Beispiel werden für eine räumliche Wichtung die ungleichmäßigen Bereiche, die einem geringeren räumlichen Koeffizienten entsprechen, mit einem kleineren Quantisierschritt kodiert, und die strukturierten Bereiche, die einem höheren Koeffizienten entsprechen, werden mit einem größeren Quantisierschritt kodiert. Somit sind die Wirkungen der Blöcke um so wichtiger, wie die Änderung des Quantisierschritts von einem Block zu einem anderen (und somit der Schritt selbst) wichtig ist, und das Auge des Betrachters ist weniger empfindlich gegenüber Wirkungen der Blöcke in den strukturierten Bereichen als in den homogenen Bereichen.

Statt der Mittelwertbildung der räumlichen Koeffizienten α für jeden Bereich könnte ebenso ein Wert α je Bereich gewählt werden, zum Beispiel der Minimal- oder Maximalwert unter den Makroblöcken, die zu demselben Bereich gehören. Es erfolgt eine Prüfung, ob zwei verschiedene Bereiche durch unterschiedliche Werte des Regelschritts kodiert sind und ob das nicht der Fall ist, zum Beispiel der identisch gewonnene Wert inkrementiert oder dekrementiert.

Beim Dekoder werden die Bereiche durch die verschiedenen Werte des Regelschritts ermittelt, die für ein Bild empfangen werden.

Eine zeitliche Angleichung der Bereiche ist außerdem bei einer Bildfolge mit ein paar zusätzlichen Anstrengungen möglich (jedoch nicht notwendig).

Zum Beispiel ist es, aus einem laufenden Makroblock, der einem Bereich n zugeordnet ist und die Anpassung des Bewegungsvektors mit einem Makroblock des vorangehenden rekonstruierten Bildes möglich, wobei dieser Makroblock einen Bereich m zugeordnet ist, möglich, den Bereich mit dem Etikett n des vorangehenden Bildes dem mit dem Etikett n des laufenden Bildes entspricht.

Die Bestimmung des Bereichs beim Dekoder kann auch durch Mittelwertbildung des durch den Koder übertragenen Regelschritts über das Bild erfolgen. Der durch die Regelschaltung beim Koder berechnete Regelschritt ändert sich von einem Bild zu dem anderen, insbesondere bei der Änderung des Kodiertyps, zum Beispiel von Intra in Inter. Durch Mittelung des Regelschritts über das Bild entspricht der gefundene Wert dem Regelschritt, der durch die Regelschaltung des Koders berechnet wird, wobei die Regelschaltung auf diesem mittleren Schritt arbeitet. Die Abweichung zwischen dem empfangenen Regelschritt und dem beim Koder berechneten Regelschritt in dem Fall, wo der Koder durch Inkrementierung oder Dekrementierung dieses Schritts arbeitet, ermöglicht daher eine zeitliche Anpassung, wenn beim Koder gewährleistet wird, dass dieselben Bereichsetiketten von einem Bild zum anderen erhalten bleiben.

In dem Fall, wo der räumliche Koeffizient beteiligt ist, wird der Wert von α durch eine einfache Teilung durch den mittleren Schritt ermittelt. Der Wert von α, der die Informationen des Bereichs liefert, muß dann für einen bestimmten Bereich über die Zeit konstant gehalten werden.

Die Bereichsinformationen sind beschränkt auf die Genauigkeit des Makroblocks. Es ist jedoch möglich, diese Auflösung zu verfeinern, zum Beispiel durch genaue Berechnung der Grenzen durch das Verfahren der Gradienten, wenn der Dekoder oder eine besondere Anwendung beim Dekoder genauere Informationen benötigt.

In den angegebenen Beispielen ist es der Regelschritt, der die Bereichsinformationen transportiert, denn es ist der Schritt, der in der MPEG-Norm zu dem Dekoder übertragen wird. Es ist natürlich ebenfalls möglich, diese Informationen durch den Quantisierschritt zu übertragen, jeder Wert, der eine vorbestimmte Funktion des Quantisierschritts ist, oder andere Informationen, die mit der Kodierung eines Makroblocks verknüpft sind und zu dem Dekoder zusammen mit dem Makroblock (Bewegungsvektoren usw.) übertragen werden, da es derartige Informationen sind, die übertragen werden, natürlich unter der Bedingung, dass die für die übertragenen Informationen erfolgte Modifikation kaum einen Einfluß auf die Qualität des dekodierten Bildes hat.


Anspruch[de]

1. Verfahren zur Komprimierung von digitalen Daten eines Videobildes, bei dem eine Zerlegung (4) des Bildes in Bildblöcke, eine diskrete Cosinustransformation (9) dieser Blöcke zur Bildung von Koeffizienten und eine Quantisierung (10) jedes Koeffizienten aus einem Quantisierschritt erfolgen, dadurch gekennzeichnet, dass

- eine Segmentierung (2) des Bildes in Bereiche zur Definition von Objekten in dem Bild,

- eine Etikettierung (2) der Bereiche, wobei jedes Etikett einen Bereich definiert,

- eine Zuordnung des Etiketts des Bereiches zu jedem der Bildblöcke, zu dem ein Block gehört,

erfolgen,

und dass jedem Block ein Block eines Regulierschritts zugeordnet wird, aus dem der Quantisierschritt jedes Koeffizienten des Blockes definiert wird, dessen Wert in Abhängigkeit von dem zugeordneten Etikett berechnet wird.

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Funktion in einer oder mehreren Inkrementierungen oder Dekrementierungen eines Wertes eines Regelschritts besteht, der für das Bild als Funktion des Einstellwertes einer Datenrate berechnet wird, und dass zwei verschiedene Blockregelschritte zwei verschiedenen Bereichen entsprechen.

3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, dass die Inkrementierungen oder Dekrementierungen gleichmäßig um den Wert des Regelschritts verteilt werden, der in Abhängigkeit von einem Einstellwert der Datenrate berechnet wird, derart, dass eine dem Datenraten-Einstellwert entsprechende mittlere Datenrate konserviert wird.

4. Verfahren nach einem der vorangehenden Ansprüche, dadurch gekennzeichnet, dass es eine Berechnung von Komplexitäts-Koeffizienten (3) für jeden Block bewirkt und dass die Berechnung des Schritts der Blockregelung in Abhängigkeit von diesem Koeffizienten erfolgt.

5. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der Komplexitäts- Koeffizient ein räumlicher Komplexitäts-Koeffizient ist, der eine räumliche Gleichmäßigkeit des in Abhängigkeit von seiner Energie berechneten Blocks wiedergibt.

6. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der Komplexitäts- Koeffizient ein zeitlicher Komplexitäts-Koeffizient ist, der in Abhängigkeit von der Amplitude der Verschiebung des Blocks von einem Bild zu einem anderen berechnet wird.

7. Verfahren nach Anspruch 4, dadurch gekennzeichnet, dass der Komplexitäts- Koeffizient durch manuelle Auswahl der bevorzugten Bereiche berechnet wird.

8. Vorrichtung zur Komprimierung von digitalen Daten eines Videobildes für die Durchführung des Verfahrens nach Anspruch 1, enthaltend:

- eine Schaltung (4) zur Zerlegung des Bildes in Bildblöcke,

- eine Schaltung (9) zur diskreten Cosinustransformation, die eine derartige Transformation des Bildblocks in Blöcke von Koeffizienten bewirkt,

- eine Quantisierschaltung (10) zur Quantisierung der Koeffizienten, die zu dem aus einem Regelschritt transformierten Block gehören,

- eine Regelschaltung (15), die einen Regelschritt eines Bildes in Abhängigkeit von einem Datenraten-Einstellwert am Ausgang der Vorrichtung berechnet, gekennzeichnet durch:

eine Segmentierschaltung (2) zur Definition der Objekte in dem Bild, zur Etikettierung dieser Objekte und zur Zuordnung eines entsprechenden Etiketts zu jedem der Bildblöcke, um diese Etiketten zu der Quantisierschaltung zu liefern, und dass die Quantisierschaltung (10) vor der Auswertung den Regelschritt in Abhängigkeit von der Etikette ändert, um einen Schritt des Regelblocks für jeden Bildblock zu liefern.

9. Vorrichtung nach Anspruch 8, dadurch gekennzeichnet, dass die Quantisierschaltung (10) den Wert des Regelschritts für die Berechnung des Quantisierschritts inkrementiert oder dekrementiert, und dass zwei verschiedene Schritte des Regelblocks zwei verschiedenen Bereichen entsprechen.

10. Vorrichtung nach Anspruch 8 oder 9, dadurch gekennzeichnet, dass die digitalen Daten zu einer Voranalyse-Schaltung (3) übertragen werden, die die räumlichen Koeffizienten bei jedem Bildblock in Abhängigkeit von der räumlichen Gleichmäßigkeit dieser Blöcke berechnet, und dass die Modifikation des Regelschritts in Abhängigkeit von diesen räumlichen Koeffizienten erfolgt.

11. Vorrichtung nach Anspruch 8 oder 9, dadurch gekennzeichnet, dass die digitalen Daten zu einer Voranalyse-Schaltung (3) übertragen werden, die die räumlichen Koeffizienten bei jedem Bildblock in Abhängigkeit von der Amplitude der relativen Bewegung jedes Blocks zu demjenigen, der einen vorangehendem Bild entspricht, berechnen und beeinflussen, und dass die Modifikation des Regelschritts in Abhängigkeit von diesen räumlichen Koeffizienten erfolgt.

12. Vorrichtung nach Anspruch 8 oder 9, dadurch gekennzeichnet, dass die digitalen Daten zu einer Voranalyse-Schaltung (3) übertragen werden, die die räumlichen Koeffizienten bei jedem Bildblock in Abhängigkeit von den Daten, die durch einen Benutzer geliefert werden, berechnet und beeinflußt, und dass die Modifikation des Regelschritts in Abhängigkeit von diesen räumlichen Koeffizienten erfolgt.

13. Vorrichtung zur Dekomprimierung von Videodaten zum Empfang der komprimierten Daten nach dem Verfahren von Anspruch 1, wobei Videodaten für die Bildblöcke zu verschiedenen Bereichen des Bildes und zu dem bei jedem Block beeinflußten Regelschritt gehören, mit einer Schaltung zur Dequantisierung der Koeffizienten, die zu einem Bildblock gehören, eine Schaltung zur inversen diskreten Cosinustransformation, die eine derartige inverse Transformation des dequantisierten Bildblocks bewirkt, gekennzeichnet durch Mittel zur Bestimmung des Bereichs, zu dem der Block aus dem für diesen Block empfangenen Regelschritt gehört.

14. Vorrichtung nach Anspruch 13, dadurch gekennzeichnet, dass die Mittel eine Mittelwertbildung des empfangenen Regelschritts für jeden Block auf dem vollständigen Bild und eine Berechnung für einen mittleren Schritt bewirken.

15. Vorrichtung nach Anspruch 13, wobei die empfangenen Daten sich auch auf Bewegungsvektoren für diese Blöcke beziehen, dadurch gekennzeichnet, dass die Gebietsfolge des Bereichs von einem Bild zu einem anderen aus den Bewegungsvektoren erfolgt.

16. Vorrichtung nach Anspruch 13, dadurch gekennzeichnet, dass die die Bereiche definierenden Etiketten identisch während der Zeit für denselben Bereich aufrecht erhalten bleiben und dass das Etikett durch die Abweichung zwischen dem Regelschritt des übertragenen Blocks und dem mittleren Regelschritt für das Bild definiert wird, zu dem dieser Block gehört.







IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com