Bildbasierte Bewegungsschätzung aus Kamerafahrten anhand prägnanter Merkmale
Organisatorisches
- Art der Arbeit: Diplomarbeit
- Status: abgeschlossen
- Interne Betreuer:
- Tobias Feldmann
- Dietrich Paulus
- Student:
- Peter Decker
- Beginn: 26.03.2007
- Ende: 26.09.2007
Beschreibung
Ziel: Während einer Kamerafahrt durch eine starre Szene wird ein Bildstrom aufgezeichnet und aus diesem anschließend die Kamerabewegung in Weltkoordinaten bildbasiert rekonstruiert. Die rekonstruierte Kamerabewegung wird in Form einer Trajektorie aufgezeichnet und möglichst präzise zurückgeliefert. Solche Daten werden beispielsweise für die bildbasierte visuelle Odometrie in der Robotik oder die Pose-Schätzung in AR-Szenarien benötigt.
Methode: Für die Rekonstruktion einer Trajektorie aus Bilddaten muss ein mehrstufiger Algorithmus durchlaufen werden:
- Im ersten Schritt werden in den einzelnen Bildern markante Merkmale detektiert.
- Im nächsten Schritt findet eine Zuordnung korrespondierender Merkmale in angrenzenden Bildern der Bildfolge statt.
- Anschließend kann aus den Punktkorrespondenzen die Bewegung der Kamera zwischen den Einzelbildern einer Bildfolge berechnet werden. Diese Berechnung kann linear oder nicht-linear über Optimierungsverfahren realisiert werden. In dieser Arbeit soll vorrangig die lineare Berechnung der Kamerapose betrachtet werden.
In den letzten Jahren gab es in mehreren Veröffentlichungen [Shimshoni2006BEA] Vorschläge zur Verbesserung der Visuellen Odometrie über eine geschickte Auswahl von prägnanten, stabilen Merkmalen, die zu einer verbesserten Poseschätzung führen. Diese Verfahren wurden in einer MATLAB-Implementierung auf Einzelbildern, jedoch nicht auf kompletten Bildsequenzen evaluiert. Eine Auswahl der erfolgversprechendsten Ansätze soll in C++ implementiert werden. Es soll damit untersucht werden, unter welchen Rahmenbedingungen sie sich für eine stabile Poseschätzung in Echtzeit eignen. Zusätzlich soll untersucht werden, ob durch eine höhere Präzision (Subpixelpräzision) der betrachteten Merkmale qualitativ bessere Ergebnisse als beim Original-BEEM-Ansatz mit pixelgenauer Merkmalsbetrachtung erreicht werden können.
Es wird eine ausführliche Literaturrecherche zu visuellen Odometry / Mono-SLAM erwartet, um das entwickelte Verfahren vom Stand der Technik abzugrenzen.
Die Implementierung erfolgt in C++ unter GNU/Linux. Für die grafische Benutzeroberfläche wird Qt4 verwendet.

Shimshoni, Ilan (2006): Balanced Exploration and Exploitation Model Search for Efficient Epipolar Geometry Estimations (BEEM). In: 9th European Conference on Computer Vision (ECCV 2006). Bd. II. S. 151-164.