Page Areas:



Current Submenu:

Additional Information:

FAW @ Lange Nacht der Forschung 2016

Lange Nacht der Forschung 2016

Campus map

Campusplan JKU Linz

Our location on campus ...  more of Campus map (Titel)

Softwarepark Hagenberg

Hier den Alternativtext zum Bild eingeben!

Our location on Softwarepark Hagenberg ...  more of Softwarepark Hagenberg (Titel)


Position Indication:

Content

Evaluierung der Rolle von Kookkurrenzen und Kollokationen in der Bestimmung der Wortbedeutung

Supervisors: A.Univ.-Prof. DI Dr. Birgit Pröll , Dipl.-Ing. Dr. Christina Feilmayr (karenziert)
Student: Markus Reschka

Abstract(DE)
Problembeschreibung: Eines der größten Probleme der IE ist die Unvollständigkeit im NLP Prozess, die wiederum zu einer Unsicherheit und schlussendlich zu einer nicht vertrauenswürdigen Information führt. Vor allem für die Bestimmung der Wortbedeutung ist zu wenig zusätzliches Wissen vorhanden, um eindeutig den Wortsinn identifizieren zu können.

Problembehebung durch Einsatz von Text Mining Aufgaben: Die NLP-Prozesse eines Informationsextraktionssystems und jenes eines Text Mining Systems unterscheiden sich nur gering. In einem Text Mining System werden vor allem Techniken zur Generierung von sogenannten Kollokationen (collocations) und Kookkurrenzen (co-occurrences) verwendet.
Kollokationen sind das gehäufte benachbarte Auftreten von Wörtern (z.B. Adresse PLZ, Java Programmiersprache, ...).
Kookkurrenzen bezeichnen das gemeinsame Auftreten zweier Wörter in einem Satz oder einem Dokument, und besagt, dass diese zwei Terme voneinander abhängig sind, da sie auffällig häufig gemeinsam auftreten (bspw. Bank sitzen).

D.h. um die Unvollständigkeit im NLP Prozess eines IE-Systems zu verringern, sollen in der Word- sense-tagging Phase (Teil der morphologischen Analyse) Kookkurrenzen und Kollokationen ermittelt, analysiert und ausgewertet werden, damit resultierend die Wortbedeutung und etwaige taxonomische Relationen identifiziert werden können.