Diplomarbeit

Titel:

Transformierung von HTML-Daten in eXtensible Topic Maps zur Visualisierung von Informationen am Beispiel des Online-Lexikons Wikipedia

 

Autor:

Twele, Lars

 

Betreuer:

Graubitz, Henner

 

Abgabedatum:

22.10.2008

 

Abstract:

Im Zeitalter von wachsenden Kapazitäten von Datenspeichern und dem fortschreitenden Digitalisieren von Daten und Informationen wird das Auffinden selbiger immer schwieriger. Zwar bieten diverse Suchmaschinen immer neue Möglichkeiten an die gewünschten Daten zu gelangen, doch stellt es sich als schwierig heraus semantisch zusammenhängende Informationen aufzufinden. Sucht man z. B. eine Biographie von Johann Sebastian Bach und gibt in einer Internetsuchmaschine "Bach Biographie" ein, so finden sich unter den ermittelten Informationen auch Beschreibungen über Gewässer und historische Erläuterungen zu Ortschaften die auf "-bach" enden. Diese Ergebnisse basieren auf Volltextsuchen und erkennen keine semantischen Informationen innerhalb der gefunden Dokumente. Ein Werkzeug zur Behebung dieser Problematik stellt XML dar. Dieses nimmt die Aufgabe war, Dokumente zu strukturieren und einzelne Abschnitte durch eigene, frei definierbare Elemente hervorzuheben. Doch "für Anfragen wie "zeige mir alle Biographien von Künstlern, die mit Johann Sebastian Bach befreundet waren", ist auch XML nicht geeignet."(vgl. Mäuck und Widhalm, 2002, S. 1-2) Eine Lösung hierfür bietet der im Spätherbst 1999 verabschiedete ISO-Standard 13250 über Topic Maps. Der Gedanke dabei ist, dass bestehende Dokumente nicht selbst verändert werden müssen. Vielmehr wird eine externe Sicht mit zusätzlichen Meta-Daten darüber gesetzt, die Topic Map. Später wurde dieser ISO-Standard dann als XML Topic Maps in XML formuliert.

 

Verweisungen:

 

pdfDiplomarbeit Lars Twele.pdf