Page Areas:



Current Submenu:

Additional Information:

FAW @ Lange Nacht der Forschung 2016

Lange Nacht der Forschung 2016

Campus map

Campusplan JKU Linz

Our location on campus ...  more of Campus map (Titel)

Softwarepark Hagenberg

Hier den Alternativtext zum Bild eingeben!

Our location on Softwarepark Hagenberg ...  more of Softwarepark Hagenberg (Titel)


Position Indication:

Content

The development of flexible camera setup for tabletop augmented reality application

Student: Eng. Ary Setijadi Prihatmanto, Msc.
Supervisors: A.Univ.-Prof. Dr. Josef Küng , DI Dr. Michael Haller
End: 15.08.2006

Abstract(DE)
Es ist bisher noch immer sehr schwer, mittels Bildverarbeitung erweiterte Umgebungen zu tracken. Einerseits liegt der Grund darin, dass die Algorithmen zu wenig robust sind, andererseits aber auch in der nicht vorhandenen Skalierbarkeit. Das weit verbreitete mathematische Kameramodell bildet den Grundstein für die Kamerakalibrierung – allerdings mit vielen Einschränkungen. Dass dieses Modell nicht geeignet ist, liegt zum einen daran, dass die Auflösung, die Geschwindigkeit und die Genauigkeit nicht die gewünschte Performance liefern. Zum anderen aber auch darin, weil das Modell zu wenig flexibel gegenüber unterschiedlichen Linsensystemen (z.B. Fischaugenobjektiv) oder unterschiedlichen Oberflächen ist. In dieser Arbeit wird auf das Design und die Umsetzung für ein effizientes Tracking Setup eingegangen, welches auf Bildverarbeitungsalgorithmen basiert. Eingangs wird ein Überblick in die Materie gegeben. Dabei wird vor allem auf die derzeitigen Probleme hingewiesen, die unmittelbar mit AR-Anwendungen (Augmented Reality-Anwendungen) in Verbindung stehen (z.B. Registrierungs- und Kalibrierungs-Problematik bei AR-basierten Tabletop-Anwendungen). Nach einem Überblick in die planaren Homographien, wird eine detaillierte Beschreibung der neuronalen Netze gegeben. Schließlich wird der auf neuronalen Netzen basierende Algorithmus vorgestellt. Neben einer detaillierten Darstellung des Algorithmus werden die Ergebnisse präsentiert. Diese Arbeit ist dabei durch die folgenden Punkten charakterisiert: (1) ein auf neuronalen Netzen basierender Algorithmus repräsentiert näherungsweise ein optimales Kameramodell. (2) Dabei entsteht eine einfach zu handhabende Kamerakalibrierung sowie (3) eine einfache Registrierung, welche in ein Framework integriert sind. Die dabei entstehenden Ergebnisse sind unabhängig von den Eigenschaften unterschiedlicher Kameras. Und schließlich ist der vorgestellt Ansatz nicht nur für ein Einfach-Kamerasystem konzipiert, sondern eignet sich auch für ein Mehr-Kamera-Setup.

Abstract(EN)
The prospective of computer vision technology in tabletop application is usually rendered unex-plored due to several critical points i.e. the availability of a robust algorithm to interpret information from images and the scalability problem. The traditional pin-hole mathematical model for camera representation as a baseline for camera calibration, usees many assumptions that limit its appicability.
Moreover, the implication of using such a model leads to techniques which suffer from the assumption and the implied problem structure induced by the model. The reason behind the inadequacy of the traditional mathematical model for camera representation is not only in per-formance side such as resolution, speed and accuracy but also more systemic in nature e.g. the trend to use a highly distorted fish-eye lens camera to get wider view angle and the use of non-standard planar surface for interaction to create different user experience. In this thesis, we analyze the above challenge in order to facilitate the design, construction and implementation of efficient use of computer vision technology in general. In particular, the thesis begins with more focus to the domain of tabletop augmented reality application. It presents the idea to use universal approximation feature of neural network to solve visual registration problem on virtual interaction surface. Additionally, other kind of visual registration problems also are ad-dressed using the extension of the basic idea. More general usage of the proposed framework in more general computer vision especially in stereo vision is illustrated. The experiment shows that the proposed framework can accommodate a wider class of problems, with more simple and clear setup to the traditional approach.
Among the results, the most important contribution includes: (1) an invention of camera repre-sentation based on the utilization of approximation function based on neural-network; (2) an invention of the calibration method for the proposed camera representation; (3) restructuring visual registration problem statements to match the proposed framework. The camera representation gives uniform representation regardless traditional camera parameters variation. This uniform camera representation gives a clear structure for systems with more than one camera. The proposed frame-work also implies more simple way to represent visual registration problems which lead to more generic structure for more general problems. Furthermore, the proposed framework shows the pos-sibility to be integrated to a more general use of camera.
That possibility is illustrated in the development of a camera pair for stereo vision which in the proposed framework has the same complexity as a single camera calibration problem.