@phdthesis{Lange2009, type = {Master Thesis}, author = {Sylvia Lange}, title = {Vergleich von Verfahren zur Tiefensch{\"a}tzung in Stereobildpaaren}, url = {https://nbn-resolving.org/urn:nbn:de:101:1-2009101973}, year = {2009}, abstract = {Die gleichzeitige Auswertung zweier r{\"a}umlich versetzter Bilder dient dem Erfassen der dritten Dimension. Wie auch der Mensch nur mit zwei Augen r{\"a}umliche Tiefe wahrnehmen kann, kann nur mit zwei oder mehr Stereobildern eine Tiefensch{\"a}tzung m{\"o}glich werden. Dabei muss einem Objekt in einem Bild das entsprechende Objekt im zweiten Bild zugeordnet werden. Da viele Pixel {\"a}hnliche Farb- und Helligkeitswerte haben k{\"o}nnen oder sich die Farbt{\"o}ne desselben Objektpunkts durch Schatteneffekte voneinander unterscheiden oder verdeckt werden, ist das so genannte \"Korrespondenzproblem\" nicht einfach zu l{\"o}sen. Laut einem Bericht von Szeliski und Zabih ist der Stand der Dinge bez{\"u}glich der Evaluation von Stereomethoden ziemlich d{\"u}rftig, obwohl eine gro{\"s}e Zahl von Algorithmen und Berichten ver{\"o}ffentlicht worden ist. Die meisten Berichte geben jedoch keine Auskunft {\"u}ber quantitative Vergleiche, und wenn, dann beschr{\"a}nken sie sich meist auf synthetische Bilder. {\"U}ber die Erstellung und Auswertung von Stereobildern wird kaum berichtet. Stereo Matching ist ein Bereich der Computer Vision, welche ein Teilgebiet der Informatik bezeichnet, das sich mit der Extraktion von Informationen aus Bildern oder Videosequenzen besch{\"a}ftigt. Die Werkzeuge der Computer Vision stammen meist aus der Mathematik, insbesondere aus der Geometrie, linearer Algebra, Statistik, Optimierung und Funktionsanalysis. Diese Werkzeuge werden in Algorithmen zur Segmentierung und Klassifizierung angewandt. Ziel des Stereo Matching ist die Zuordnung zweier Stereobilder zueinander mit dem Ergebnis einer dichten Tiefenkarte. In diesem Bild werden die in den Stereoaufnahmen vorhandenen Objekte in verschiedenen Graut{\"o}nen wiedergegeben, wobei ein dunkler Ton einen gro{\"s}en Abstand zur Kamera bedeutet, ein heller Ton einen geringen Abstand. Aus den Helligkeiten k{\"o}nnen die Entfernungen berechnet werden. Der Begriff der dichten (\"dense\") Tiefenkarte bedeutet in diesem Zusammenhang, dass die Tiefenkarte ein System voller Werte und mit so wenig Elementen ohne Information ist, dass sie behandelt werden kann, als h{\"a}tte sie keine solchen Elemente. Somit kann jedem Bildpunkt eine Disparit{\"a}t zugeordnet werden. Das Korrespondenzproblem muss also f{\"u}r jedes Pixel des Referenzbildes gel{\"o}st werden. Daf{\"u}r ist ein {\"A}hnlichkeitsma{\"s} n{\"o}tig, welches {\"u}berall im Bild angewandt werden kann. Im Gegensatz dazu enth{\"a}lt eine \"sparse\" Tiefenkarte nur an relevanten Stellen wie Kanten Informationen. Einige aktuelle Stereoverfahren sollen in dieser Arbeit mit selbst aufgenommenen Stereobildern getestet und bewertet werden.}, language = {de} }