Page Areas:



Current Submenu:

Additional Information:

FAW @ Lange Nacht der Forschung 2016

Lange Nacht der Forschung 2016

Campus map

Campusplan JKU Linz

Our location on campus ...  more of Campus map (Titel)

Softwarepark Hagenberg

Hier den Alternativtext zum Bild eingeben!

Our location on Softwarepark Hagenberg ...  more of Softwarepark Hagenberg (Titel)


Position Indication:

Content

Ontologiebasierte Informationsextraktion in webbasierten Tourismusinformationssystemen

Supervisor(s): A.Univ.-Prof. DI Dr. Birgit Pröll , Dipl.-Ing. Dr. Jürgen Palkoska
Student: Christina Feilmayr
Start: 01.06.2007 , End: 2007

Abstract(DE)
Durch die zunehmende Informationsmenge, die im World Wide Web zur Verfügung steht, ist das Gebiet der Informationsextraktion und der Wunsch nach gezielter Suche immer größer geworden. Die Informationsextraktion soll Daten von Interesse aus Webseiten extrahieren, diese anhand eines Wissens identifizieren, und so abspeichern, dass sie weiterverarbeitet werden können.

Es gibt eine Vielzahl von Ansätzen um Information effizient zu extrahieren. Aussage über Effektivität der Verfahren gibt letztendlich die Qualität. Im Zuge dieser Diplomarbeit wurde ein solches Informationsextraktionssystem realisiert, dessen Extraktionswissen unter anderem auf einer Ontologie basiert.

Die TourIE Plattform bietet eine umfangreiche Wissens- und Informationsmanagement-Infrastruktur und ein Service für die automatische semantische Annotierung. Die Applikation stellt sowohl die Komponenten für die Verarbeitung des Textes, basierend auf GATE, als auch ein Annotierungswerkzeug dar. Der Schwerpunkt liegt in der Modellierung des Wissens, der Ontologie und den Extraktionsregeln, die zusammen ein ontologiebasiertes Informationsextraktion-System bilder. TourIE ist mit einer solchen Ontologie und einer Wissensbasis, die die Entitäten des Tourismus abdeckt, ausgestattet. Die Ontologie und die Wissensbasis umfassen Semantic-Web Technologien und diverse Standards, wie OWL, RDFS und diverse Intergrationsplattformen.

Vom technischen Standpunkt gesehen, bietet die TourIE-Applikation eine automatische semantische Annotierung durch definierte Regeln und der Wissensbasis, und eine anschließende kompkate Zusammenfassung der Information in strukturierter Darstellungsform.

Diese Arbeit soll die Architektur von TourIE, mit besonderen Augenmerk auf deren Wissensbasis, Schnittstellen, Werkezeuge, Technologien und Standards, darlegen.

Abstract(EN)
Because of the information overload in the World Wide Web, information extraction (IE) becomes one of the core technologies to help facilitate highly focused retrieval. IE extracts relevant information from natural language text, identifies the entities by linking them to its semantic description in the instance base, and stores them in an structured file for postprocessing.

There are many approaches how to extract information efficiently. In the end, the performance of the different approaches is the main criteria for quality. The aim of this thesis is to build an information extraction system, which adapts its knowledge from an ontology.

The TourIE platform provides a knowledge and information management infrastructure and services for automatic semantic annotation. The application allocates the processing components for some natural language documents using GATE and provides an annotation tool. The emphasis lies in the modelling of knowledge, ontology and extraction rules. Everything is combined to an ontology-based information extraction system. TourIE is equipped with an ontology and a knowledge based which provides a high coverage of entities in tourism applications. The ontology and knowledge base use some Semantic Web technologies, like standards such as RDFS and OWL, as well as some ontology middleware.

From the technical point of view, the TourIE platform allows automatic semantic annotation using the underlying ontology and extraction rules, and provides a summarization of the extracted information in a structured output.

This thesis should give a survey of the archictecture of TourIE, with special attention to the knowledge base, interfaces, tools, techonologies and standards, which were used during the implementation.