PatentDe  


Dokumentenidentifikation DE19810014A1 23.09.1999
Titel Verfahren zum Zuordnen von mittels zwei Kameras in verschiedenen Ansichten aufgenommenen Stereobildern
Anmelder Deutsches Zentrum für Luft- und Raumfahrt e.V., 53175 Bonn, DE
Erfinder Wei, Guo Quing, 82205 Gilching, DE
Vertreter von Kirschbaum, A., Dipl.-Ing., Pat.-Anw., 82110 Germering
DE-Anmeldedatum 09.03.1998
DE-Aktenzeichen 19810014
Offenlegungstag 23.09.1999
Veröffentlichungstag im Patentblatt 23.09.1999
IPC-Hauptklasse G01C 11/06
IPC additional class // G01C 11/02  
Zusammenfassung Zum Zuordnen von mittels zwei Kameras in verschiedenen Ansichten aufgenommenen Stereobildern werden Helligkeit und Merkmale, wie Bildpunkte, deren Gradientengröße über einem Schwellenwert (Tg) liegt, der beiden Stereobilder in einer einheitlichen Weise kombiniert, und es wird eine Glättungsfunktion nur in homogenen Bildregionen eingeführt. Anschließend werden durch ein "Radikal-Basis-Funktions"-Netzwerk Disparitätsfunktionen parametrisiert und es wird ein lineares Modell zur Kompensation der Helligkeitsunterschiede zwischen korrespondierenden Punkten angewendet. Zur Minimierung eines Fehlermaßes bei Korrespondenzsuche wird ein Gradientabstiegsverfahren verwendet.

Beschreibung[de]

Die Erfindung betrifft ein Verfahren zum Zuordnen von mittels zwei Kameras in verschiedenen Ansichten aufgenommenen Stereobildern.

Die stereooptische Formerfassung räumlicher Objekte hat ein weites Anwendungsfeld in vielen sehr unterschiedlichen Bereichen. Beispiele hierfür sind u. a. die Fernerkundung, die Robotik, der Denkmalschutz und der VR-Bereich (virtual reality).

Bei der Fernerkundung werden Bilder der Erdoberfläche von Luft- oder Raumfahrzeugen aus aufgenommen und zur Erstellung digitaler Geländemodelle ausgewertet. Auf ähnliche Weise sollen in der Robotik dreidimensionale Modelle der Arbeitsumgebung eines Roboters erstellt werden. Im Denkmalschutz sollen Gebäude, von denen keine Baupläne vorhanden sind, auf einfache Weise vermessen werden, indem sie aus unterschiedlichen Ansichten photographiert und die Bilder stereooptisch auswertet werden. Für die Objekte einer VR-Umgebung sind der Phantasie keine Grenzen gesetzt.

Zwei Bildpunkte eines stereooptischen Bildpaares heißen korrespondierende (homologe) Punkte, wenn sie Bildpunkte desselben Objektpunktes sind. Das Grundproblem bei der stereooptischen Bildauswertung ist die eindeutige Identifizierung und exakte Lokalisierung korrespondierender Punkte.

Diese Arbeit wird bis jetzt häufig von geschultem Personal ausgeführt und ist aus folgenden Gründen nur sehr schwer automatisierbar. In stark strukturierten oder auch in periodischen Bildbereichen ist das Risiko für Verwechslungen hoch, in homogenen Bildbereichen ist dagegen eine exakte Lokalisierung schwer. Es gibt mehrere Ansätze zur automatischen Bestimmung von Stereokorrespondenzen, aber noch keine allgemeinbefriedigende Lösung.

Konventionelle Techniken zur Stereokorrespondenzsuche lassen sich in drei Gruppen einteilen, nämlich einen flächenbasierten, einen merkmalsbasierten und einen grauwertbasierten Ansatz.

Der flächenbasierte Ansatz setzt konstante Disparität in einer Region ("Fenster") um den betrachteten Bildpunkt voraus. Das Ziel dabei ist, durch Verwenden der Bildstruktur im Fenster Korrespondenz-Mehrdeutigkeiten aufzulösen. Ein bekannter hierfür geeigneter Ansatz ist die Korrelationsmethode, bei der solche Bildpunktpaare gesucht werden, deren Umgebungen einander am "ähnlichsten" sind. Dafür gibt es schnelle Hardware, die eine effiziente Implementierung ermöglicht.

Allerdings ist die Voraussetzung bei diesem Ansatz im allgemeinen nicht erfüllt, sondern sie wird sogar in der Praxis mit hoher Wahrscheinlichkeit verletzt, wobei die Wahrscheinlichkeit für Verletzungen mit zunehmender Fenstergröße wächst. Die Folge davon sind Lokalisationsfehler. Anderseits wächst mit abnehmender Fenstergröße sowohl die Wahrscheinlichkeit für Fehlzuordnungen (falsche Identifizierungen) als auch der Einfluß des Kamerarauschens auf Lokalisationsfehler.

Der merkmalsbasierte Ansatz beschränkt sich im ersten Schritt auf robust identifizierbare und lokalisierbare Bildstrukturen (Merkmale). Das augenfälligste Beispiel eines Merkmals ist die "Bildkante", die dort ist, wo sich der Grauwerteverlauf schnell ändert.

Der merkmalsbasierte Ansatz hat den Vorteil, daß er sich auf den als zuverlässig anzunehmenden Teil der Bildinformation abstützt, hat jedoch den Nachteil, daß er im allgemeinen nur eine "dünn besetzte" Disparitätenkarte, z. B. nur für die Kanten, liefert; der Rest der Karte muß durch Interpolation aufgefüllt werden. Das Interpolationsergebnis hängt einerseits vom gewählten Interpolationsverfahren ab, anderseits bleibt die im Interpolationsgebiet verfügbare Bildinformation ungenutzt.

Der grauwertbasierte Ansatz setzt gleiche Granwerte für korrespondierende Punkte voraus. In dieser strengen Form wird die Voraussetzung häufig verletzt, da schon der unterschiedliche Strahlengang von einem Objektpunkt in die zwei Bildebenen eine Grauwertverschiebung bewirken kann. In einer gemilderten Form werden "fast gleiche" Grauwerte vorausgesetzt.

Diese Voraussetzung ist in der Regel gut erfüllt. Der grauwertbasierte Ansatz hat den Vorteil, daß er ohne eine Annahme über den Disparitätsverlauf in der umgebenden Region auskommt, daß er ferner eine dichte Disparitätenkarte (ohne Interpolation) liefert, außerdem keine Merkmalsextraktion erfordert, und daß er schließlich die ganze Bildinformation nutzt. Der grauwertbasierte Ansatz hat den gravierenden Nachteil, daß er empfindlich gegenüber Mehrdeutigkeiten ist, und daher in der Disparitätenkarte große Fehler durch Fehlzuordnungen auftreten können.

Aufgabe der Erfindung ist es, zu einer numerischen Lösung des Problems der Stereokorrespondenz hinsichtlich Identifizierung und Lokalisierung von Stereobildpaaren ein Verfahren anzugeben, mit welchem auch bei schwierigem Bildmaterial sehr viel zuverlässigere Ergebnisse erhalten werden als mit bekannten Ansätzen, so daß es als Basis für die automatische stereooptische digitale Bildauswertung dienen kann.

Gemäß der Erfindung ist diese Aufgabe mit einem Verfahren zum Zuordnen von mittels zwei Kameras in verschiedenen Ansichten aufgenommenen Stereobildern mit den Merkmalen des Anspruchs 1 gelöst. Vorteilhafte Weiterbildungen sind Gegenstand der auf den Anspruch 1 unmittelbar oder mittelbar rückbezogenen Ansprüche.

Das erfindungsgemäße Verfahren liefert als Ergebnis eine Disparitätenkarte. Wegen der zentralen Bedeutung der Begriffe Disparität und Disparitätenkarte werden diese Begriffe zunächst erläutert. Die paralaktische Bildpunktverschiebung in einem stereooptischen Bildpaar heißt Disparität d. Für zwei korrespondierende Punkte PL = (xL, yL)T und PR = (xR, yR)T gilt:



d = (u, v)T = (xL-xR, yL-yR)T.

Hierbei sind x und y die Bildkoordinaten und u und v die Komponenten der Verschiebungsvektors in den Bildkoordinaten x und y. In Anlehnung an das menschliche Augenpaar - linkes und rechtes Auge - werden die aus einem stereooptischen Bildpaar abgeleiteten Größen durch die Indizes L und R unterschieden.

Ein dichtes Feld von Disparitäten, ein Verschiebungsvektorfeld, über einem Bildausschnitt (oder einem ganzen Bild) heißt Disparitätenkarte



d(x, y) ~ (u(x, y), v(x, y))T.

Unter den Voraussetzungen, daß eine Bildaufnahme verzeichnungsfrei erfolgt, beide Kameras in allen Achsen parallel orientiert sind, und sich ihre Position nur durch eine Verschiebung entlang der x-Achse unterscheidet, gilt: v(x, y) ~ 0. Die Disparitätenkarte ist dann die meßtechnische Darstellung der Entfernungskarte.

Zum Berechnen des Entfernungskarte aus der Disparitätenkarte ist die Kenntnis der Bildaufnahmegeometrie und der Kamera-Abbildungseigenschaften erforderlich. Dieser Auswerteschritt ist nicht Gegenstand der Anmeldung und wird daher auch nicht behandelt.

Gemäß der Erfindung besteht ein erster Lösungsweg darin, verschiedene Ansätze in einem geschlossenen Algorithmus so miteinander zu verbinden, daß sie sich gegenseitig in der Wirkung ihrer positiven Eigenschaften verstärken. Dadurch sind bessere Ergebnisse zu erwarten, als wenn verschiedene Ansätze unabhängig voneinander realisiert werden und nur die Ergebnisse vergleichend ausgewertet würden.

Besonders attraktiv erscheint dabei die Verbindung eines merkmalsbasierten Ansatzes mit einem grauwertbasierten Ansatz, und zwar der merkmalbasierte Ansatz wegen seiner hohen Zuverlässigkeit an Merkmals-Bildstellen und der grauwertbasierte Ansatz zur Unterstützung der Interpolation mit vollständiger Bildinformation. Hierbei erfolgt die Verbindung durch die Minimierung eines globalen Gütekriteriums, zu dem beide Ansätze Beiträge liefern. Zur Stabilisierung des Algorithmus in homogenen und daher kritischen Bildbereichen wird dem Gütekriterium noch ein parametrisierbarer Glattheitsterm hinzugefügt. Dieses modifizierte Gütekriterium wird nachstehend als Korrespondenzfehlermaß bezeichnet.

Das Korrespondenzfehlermaß kann neben dem gesuchten Minimum jedoch noch weitere Minima aufweisen, und ist daher in diesem Sinne nicht eindeutig. Ein zweiter Lösungsweg betrifft die effiziente Auflösung solcher Mehrdeutigkeiten. Dazu wird die Disparitätenkarte parametrisch, in einer hierarchischen Schichtenstruktur mit unterschiedlichen Auflösungsgraden dargestellt und das Optimierungsproblem wird sequentiell, d. h. Schicht für Schicht, in der Richtung von grober zu feiner Auflösung gelöst. Die Parameter einer Schicht bleiben nach dem Optimierungsschritt für diese Schicht fest.

Im Gegensatz zur Darstellung der Disparitätenkarte durch unabhängige Variable für jeden Bildpunkt (direkter Ansatz), wird bei der Vorgehensweise gemäß der Erfindung folgendes erreicht. In den gröberen Schichten sind Mehrdeutigkeiten weniger wahrscheinlich als in den feineren Schichten. Mit der Information aus den schon bearbeiteten Schichten ist das Fehlerrisiko (durch lokale Minima) in der aktuellen Schicht geringer als ohne dieses Vorwissen.

Ferner wird durch die parametrische Repräsentation und die sequentielle Vorgehensweise die Anzahl der freien Parameter in jedem Optimierungsschritt sehr viel kleiner als beim direkten Ansatz. Als Basisfunktion wird die Exponentialfunktion mit negativem quadratischem Exponenten verwendet, die auf dem Gebiet der Neuronalen Netze als Radial-Basis-Funktion bekannt ist, und dort wegen mehrerer günstiger Eigenschaften breite Verwendung gefunden hat.

Schließlich kann das stereooptische Bildpaar von zwei Kameras mit unterschiedlicher photometrischer Empfindlichkeit stammen, z. B. durch unterschiedliche Blendeneinstellung. In diesem Fall wäre die Voraussetzung für den Grauwert-Fehlerterm verletzt. Ein dritter Lösungsweg löst dieses Problem dadurch, das eine photometrische Bildkorrektur mitgeschätzt wird. Hierbei wird (für die Blendenverstellung) ein lineares Korrekturmodell mit konstanten Parametern für die Grauwerte aller Bildpunkte eines der beiden Bilder verwendet. Dieses entspricht einer globalen Helligkeits- und Kontrastanpassung.

Nachfolgend wird die Erfindung unter Bezugnahme auf die anliegenden Zeichnungen erläutert. Es zeigen:

Fig. 1 schematisch eine Verteilung von RBF-Neuronen in drei Schichten;

Fig. 2a und 2b ein stereooptisches Bild;

Fig. 2c eine grauwertcodierte Disparitätenkarte;

Fig. 2d eine Disparitätenkarte mit Linien gleicher Disparität;

Fig. 2e ein linkes Originalbild mit Testpunkten (x) und vertikalen Testlinien;

Fig. 2f ein rechtes Originalbild mit korrespondierenden Punkten (x) und (vertikalen) Kurven sowie Testpunkten (+) und vertikalen Linien des rechten Bildes;

Fig. 2g das Differenzbild eines stereooptischen Bildpaares, und

Fig. 2h das Differenzbild nach der Zuordnung.

Die Disparitat ist auf die Koordinaten des linken Bildes bezogen und zur Abkürzung der Schreibweise wird die nachstehende Notation für die Koordinaten eines stereooptischen Bildpaares verwendet:



(x, y) = (xL, yL) und (x', y') = (xR, yR) (1).

Ein Korrespondenzfehlermaß hat die folgende Funktionen und Ableitungen:

  • a) Bildfunktionen (Grauwertfunktionen) des Bildpaares



    IL(x, y), IR(x', y') (2)

  • b) deren erste Ableitungen nach den Bildkoordinaten



    ILx(x, y), ILy(x, y) und IRx'(x', y'), IRy'(x', y') und (3)

  • c) die ersten und zweiten Ableitungen einer (geschätzten) Disparitätenkarte



    ux, uy, vx, vy, und uxx, uxy, uyy, vxx, vxy, vyy (4).

Die Bildfunktionen werden im Sinne eines grauwertbasierten Ansatzes, die ersten Ableitungen werden im Sinne eines merkmalbasierten Ansatzes und die zweiten Ableitungen werden zur Formulierung eines Gutemaßes für die Glattheit der Disparitätenkarte in homogenen Bildregionen verwendet. Zunächst wird beschrieben, auf welchen Modellen das Korrespondenzfehlermaß beruht.

Für ein korrespondierendes Punktepaar gilt



(x', y') = (x + u(x, y), y + v(x, y)) (5).

Für den grauwertbasierten Ansatz gilt dann das Modell:



IL(x, y) = IR(x', y') = IR(x + u(x, y), y + v(x, y)) (6).

Für den merkmalsbasierten Ansatz gilt das Modell:



ILx(x, y) = IRx'(x', y') (1 + vx(x, y)) + IRy'(x', y') vx(x, y) (7)



ILy(x, y) = IRx'(x', y') uy(x, y)) + IRy'(x', y') (1 + vy(x, y) (8).

In homogenen Bildregionen liefert ein grauwertbasierter Ansatz keine oder nur unzuverlässige Information über die Disparitat, während ein merkmalsbasierter Ansatz keine Information liefert. Daher wird für homogene Bildregionen eine Glattheitsforderung an die Disparitätskarte eingeführt. Die Glattheit G(x, y) der Disparitätenkarte wird durch die Summe der Quadrate ihrer zweiten Ableitungen modelliert.

G(x, y) = u2xx(x, y) + u2xy(x, y) + u2yy(x, y) + v2xx(x, y) + v2xy(x, y) + v2yy(x, y) (9).

Aus diesen Modellen wird dann das Korrespondenzfehlermaß E(d(x, y)), wie folgt, gewonnen:





welches die Qualität der Anpassung der Disparitätskarte d(x, y) an die Bilddaten beschreibt. Hierbei drückt aus die erste Summe den Beitrag des grauwertbasierten Ansatzes, die zweite Summe den Beitrag des merkmalbasierten Ansatzes und die dritte Summe die Glattheitsforderung. Der Einfluß des Glattheitstermes ist mit dem Gewichtsparameter λ einstellbar.

Die Auswertung der Einzelbeiträge erfolgt jeweils nur in den "relevanten" Bildregionen, und zwar, der Grauwertterm im ganzen Bild D, der Merkmalsterm nur in inhomogenen Bildregionen F und der Glattheitsterm nur in den dazu komplementären homogenen Regionen F.

Als Maß für die Homogenität wird die Quadratsumme der beiden ersten Bildableitungen (siehe Gl. (3)) verwendet, und diese wird mit einem Schwellwert Tg verglichen, um homogene von inhomogenen Bildregionen zu trennen. Die Disparitätenkarte wird durch Minimierung des Korrespondenzfehlermaßes bestimmt.

Die Disparitätskarte wird durch gewichtete Summen radialsymmetrischer Exponentialfunktionen mit negativ quadratischen Exponenten (Radial-Basisfunktion: RBF) dargestellt





Hierbei sind tk und σk Positionen {tk} und Breiten {σk} von Basisfunktionen und werden so gewählt, daß die Disparitätsfunktionen in einer hierarchischen Schichtenstruktur zunehmenden Auflösungsgrades dargestellt werden können (siehe Fig. 1). In Anlehnung an den Sprachgebrauch in dem Gebiet der Neuronalen Netze werden die Knoten der Schichten Neuronen genannt. Ihre Gewichte {ak, bk mit k = 0 . . . N} sind Variable zur Anpassung der Disparitätenkarte an die Bilddaten.

Bei einer Bildgröße von 2M × 2M Pixel werden H = M-1 Schichten mit exponentiell zunehmender Neuronenzahl (Auflösung) 2h X 2h: h = 0, 1, . . . H verwendet. In jeder Schicht werden die Neuronen auf den Gitterpunkten eines quadratischen Gitters angeordnet. Die Gitterweite g(h) jeder Schicht folgt aus der Bildgröße und der Anzahl der Neuronen. Zur Anpassung des Einflußbereiches der Neuronen an die unterschiedlichen Gitterweiten wird σk = g(h) für jede Schicht gewählt.

Ein Schätzen der Gewichte erfolgt schichtweise in der Richtung von grober zu feiner Auflösung. Jede Schicht wird vollständig bearbeitet, d. h. sie wird nach einem Wechsel in die höhere Schicht nicht mehr verändert. Die Bearbeitung einer Schicht erfolgt in einem iterativen Verfahren auf der Grundlage der stochastischen Gradientenmethode. Jedes Element di der (diskreten) Disparitätenkarte hat in jeder Schicht eine individuelle Untermenge von Neuronen, die einen nennenswerten Beitrag liefern, nämlich die "aktiven Neuronen". Deren Gewichte werden schichtweise zu individuellen Gewichtsvektoren Wi zusammengefaßt.

Ein Schätzen der Gewichte erfolgt durch iterative Gewichtsanpassung. Dazu werden die Gewichte im n-ten Iterationschritt, abhängig vom Gradienten des Korrespondenzfehlermaßes und abhängig von der Gewichtsveränderung im vorangegangenen, dem (n-1)-ten Iterationsschritt nach der folgenden (Lern-)Regel verändert:





Die Konstanten α und β heißen "Momentterm" und "Lernrate". Typische Werte sind α = 0,6 und β = 0,1. Diese Anpassung erfolgt der Reihe nach für jedes Element der Disparitätenkarte. Das Bearbeiten einer Schicht wird auf diese Weise solange wiederholt, bis die Gewichte stationäre Werte annehmen.

Bisher wurde angenommen, daß korrespondierende Punkte gleichen Grauwert haben. Wenn das stereooptische Bildpaar von zwei verschiedenen Kameras stammt, dann ist mit unterschiedlicher photometrischer Empfindlichkeit zu rechnen. Dieser Unterschied wird durch ein lineares Modell



AIL(x, y) + B = IR(x', y') (15)



in der Form einer Kalibrierfunktion (Korrekturfunktion) für die Helligkeit und den Kontrast des linken Bildes modelliert. Die Parameter A und B werden durch eine Ausgleichsrechnung im Sinne minimaler Fehlerquadrate beginnend mit den Anfangswerten A = 1 und B = 0 bestimmt. Eine photometrische Kalibrierung und die Schätzung der Disparitätenkarte werden abwechselnd durchgeführt, so lange bis alle Variablen stationäre Werte angenommen haben.

In Fig. 2a und 2b ist ein Stereobildpaar einer Szene wiedergegeben, die von INRIA, Frankreich zum Testen von Stereoalgorithmen entwickelt wurde. Man erkennt darin sowohl stark strukturierte und unstrukturierte Bildbereiche als auch einen Helligkeits- und Kontrastunterschied im gesamten Bildbereich. Das Bildpaar ist geometrisch korrigiert (entzerrt), so daß nur Disparitäten in der x-Achse des Bildkoordinatesystems vorhanden sind (v(x, y) ~ 0).

Mit dem vorstehend beschriebenen Verfahren wurde die Disparität u(x, y) geschätzt, und das Ergebnis bildlich dargestellt. In der Graubilddarstellung von Fig. 2c bedeuten hellere Grauwerte eine größere Disparität und daher eine geringere Entfernung. In Fig. 2d sind von derselben Szene Linien gleicher Disparität dargestellt, die wie Höhenlinien einer Landkarte gelesen werden können. Die beiden Darstellungen entsprechen qualitativ dem visuellen Tiefeneindruck bei Betrachtung der Originalbilder. Eine quantitative Überprüfung ist derzeit nicht möglich, weil Referenzdaten nicht zur Verfügung stehen.

Um die geschätzte Disparitätsfunktion in einer objektiveren Weise zu überprüfen, wurde eine interaktive Vorgehensweise entwickelt. Dabei kann im linken Bild eine beliebige Stelle (per Maus-Click) markiert werden. Die Marke in dem linken Bild wird unter Verwendung der Disparitätenkarte auf das rechte Bild abgebildet. In Fig. 2e sind zwanzig Testpunkte im linken Bild mit "+" markiert, und in Fig. 2f die korrespondierenden Punkte im rechten Bild ebenso. Man erkennt, daß die automatische Korrespondenzsuche auf ein Ergebnis führt, das von einem ausgebildeten Bildauswerter vermutlich kaum übertroffen werden dürfte.

Zur Veranschaulichung der zu lösenden Schwierigkeiten wurden in Fig. 2f außerdem die Originalpunkte durch ein "x" markiert. Wie im vorderen Bildbereich zu erkennen ist, wurden richtige Korrespondenzen, auch über komplexe Bildstrukturen hinweg, richtig gefunden.

Eine weitere Unterstützung der Beurteilung erhält man durch vertikale Testlinien im linken Bild, und deren korrespondierenden Linien (vertikale Kurven) im rechten Bild. Auch hier erhält man den Eindruck, das die gefundenen Korrespondenzen die tatsächlichen sehr gut repräsentieren.

Fig. 2g zeigt das Differenzbild der Originalbilder von Fig. 2a und 2b. Man erkennt erhebliche Differenzen (ausgedehnte helle Stellen). Nach Entzerrung des rechten Bildes entsprechend der Disparitätenkarte, ergeben sich nur noch geringe Restfehler (Fig. 2h), was als ein weiterer Hinweis für die korrekte Korrenzpondenzsuche gewertet werden kann.


Anspruch[de]
  1. 1. Verfahren zum Zuordnen von mittels zwei Kameras in verschiedenen Ansichten aufgenommenen Stereobildern, dadurch gekennzeichnet, daß

    Helligkeit und Merkmale der beiden Stereobilder in einer einheitlichen Weise kombiniert werden,

    eine Glättungsfunktion nur in homogenen Bildregionen eingeführt wird,

    durch ein "Radial-Basis-Funktions"-Netzwerk Disparitätsfunktionen parametrisiert werden,

    ein lineares Modell zur Kompensation der Helligkeitsunterschiede zwischen korrespondierenden Punkten angewendet wird, und

    ein Gradientabstiegsverfahren zur Minimierung eines Fehlermaßes bei Korrespondenzsuche verwendet wird.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
    1. a) die Merkmale Bildpunkte sind, deren Gradientengröße über einem Schwellenwert (Tg) liegt;
    2. b) die Gradienten sowohl in x-Richtung (Achse) als auch in y-Richtung eines Bildkoordinatesystems verwendet werden, und
    3. c) Helligkeit und Gradienten durch einfache Summierung der Helligkeitsfehler und Gradientenfehler korrespondierender Punkte kombiniert werden.
  3. 3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, daß eine quadratische Glättungsfunktion, basierend auf den zweiten, Ableitungen der Disparitätsfunktionen, verwendet wird, wobei nur ein Bildgebiet eingeführt wird, in dem die Gradientengröße kleiner als der Schwellenwert (Tg) sind.
  4. 4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das "Radial-Basis-Funktions"-Netzwerk in einer hierarchischen Weise eingeführt wird, und Stufen der Schichten den Anordnungen der Positionen und Größen der RBF-Neuronen entsprechen.
  5. 5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß
    1. a) Positions- und Größenparameter in einer bestimmten Schicht invers proportional zur Schichtennummer ausgewählt werden, d. h., in einer höheren Stufe haben die RBF-Neuronen schmalere Stütze (kleinere {σ}), und
    2. b) nur durch Gewichte der RBF-Neuronen als freie Parameter die Disparitätsfunktionen bestimmt werden.
  6. 6. Verfahren nach Anspruch 4 und 5, dadurch gekennzeichnet, daß die Gewichte der RBF-Neuronen in einer "Coarse-to-fine" Weise geschätzt werden, indem zunächst nur die der untersten Stufe entsprechenden Gewichte geschätzt werden, und danach die höheren Hierarchien bearbeitet werden.
  7. 7. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Parameter des linearen Modells zum Ausgleich der Helligkeitsunterschiede zwischen korrespondierenden Punkten in einem "Leastsquare"-Verfahren bestimmt werden, und zwar iterativ abwechselnd mit der Disparitätsschätzung.
  8. 8. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß statt des auf dem Gradientabstieg basierenden Minimierungsverfahrens jedes andere Verfahren zur Funktionsminimierung einsetzbar ist.






IPC
A Täglicher Lebensbedarf
B Arbeitsverfahren; Transportieren
C Chemie; Hüttenwesen
D Textilien; Papier
E Bauwesen; Erdbohren; Bergbau
F Maschinenbau; Beleuchtung; Heizung; Waffen; Sprengen
G Physik
H Elektrotechnik

Anmelder
Datum

Patentrecherche

Patent Zeichnungen (PDF)

Copyright © 2008 Patent-De Alle Rechte vorbehalten. eMail: info@patent-de.com