Volltext-Downloads (blau) und Frontdoor-Views (grau)
  • Treffer 6 von 27
Zurück zur Trefferliste

Exploration von Textkorpora - Topic Models als Grundlage der Interaktion

  • Das Internet birgt schier endlose Informationen. Ein zentrales Problem besteht heutzutage darin diese auch zugänglich zu machen. Es ist ein fundamentales Domänenwissen erforderlich, um in einer Volltextsuche die korrekten Suchanfragen zu formulieren. Das ist jedoch oftmals nicht vorhanden, so dass viel Zeit aufgewandt werden muss, um einen Überblick des behandelten Themas zu erhalten. In solchen Situationen findet sich ein Nutzer in einem explorativen Suchvorgang, in dem er sich schrittweise an ein Thema heranarbeiten muss. Für die Organisation von Daten werden mittlerweile ganz selbstverständlich Verfahren des Machine Learnings verwendet. In den meisten Fällen bleiben sie allerdings für den Anwender unsichtbar. Die interaktive Verwendung in explorativen Suchprozessen könnte die menschliche Urteilskraft enger mit der maschinellen Verarbeitung großer Datenmengen verbinden. Topic Models sind ebensolche Verfahren. Sie finden in einem Textkorpus verborgene Themen, die sich relativ gut von Menschen interpretieren lassen und sind daher vielversprechend für die Anwendung in explorativen Suchprozessen. Nutzer können damit beim Verstehen unbekannter Quellen unterstützt werden. Bei der Betrachtung entsprechender Forschungsarbeiten fiel auf, dass Topic Models vorwiegend zur Erzeugung statischer Visualisierungen verwendet werden. Das Sensemaking ist ein wesentlicher Bestandteil der explorativen Suche und wird dennoch nur in sehr geringem Umfang genutzt, um algorithmische Neuerungen zu begründen und in einen umfassenden Kontext zu setzen. Daraus leitet sich die Vermutung ab, dass die Verwendung von Modellen des Sensemakings und die nutzerzentrierte Konzeption von explorativen Suchen, neue Funktionen für die Interaktion mit Topic Models hervorbringen und einen Kontext für entsprechende Forschungsarbeiten bieten können.
  • The internet offers a seemingly infinite amount of information. A central issue of our days is to make use of this nformation. To formulate efficient search queries a user must have good domain knowledge. Often this is not the case, wherefore a lot of time has to be invested to get an overview of the topic in question. In those situations a user ends up in an exploratory search process, in which he has to outline the individual topics step by step. By now machine learning algorithms are frequently used in data organization but stay invisible to the user for most of the time. The interactive use of these methods could optimize search processes by connecting the human ability to judge with machine processing powers used on large data sources. Topic models are algorithms that find latent topics in unstructured text corpora and are relatively good to interpret. Their use is promising in exploratory search processes, in which a user has to gain new domain knowledge quickly. It appears that many researches use topic models mostly to generate static visualizations of latent text structures. Sensemaking is an essential part of exploratory search processes but it is still only used to a small extent in order to justify algorithmic novelties and bring them into a larger context. Therefore the assumption is derived, that the use of sensemaking models and user centered concepts for exploratory search processes could lead to the development of new ways to interact with topic models and to generate a framework for publications of the correlating research fields.

Volltext Dateien herunterladen

Metadaten exportieren

Weitere Dienste

Teilen auf Twitter Suche bei Google Scholar

Statistik

frontdoor_oas
Metadaten
Verfasserangaben:Lennart Renker
URN:urn:nbn:de:hbz:832-epub4-6686
Gutachter:Kristian Fischer
Dokumentart:Masterarbeit/Diplomarbeit
Sprache:Deutsch
Veröffentlichende Institution:Hochschulbibliothek der Technischen Hochschule Köln
Titel verleihende Institution:Technische Hochschule Köln
Datum des Hochladens:16.10.2015
GND-Schlagwort:Explorative Suche; Mensch-Maschine-Kommunikation; Sinnkonstitution
Freies Schlagwort / Tag:Information seeking; Interactive information retrieval; Sensemaking; Topic modeling
Seitenzahl:117
Fakultäten und Zentrale Einrichtungen:Informatik und Ingenieurwissenschaften (F10) / Fakultät 10 / Advanced Media Institute
CCS-Klassifikation:H. Information Systems
DDC-Sachgruppen:000 Allgemeines, Informatik, Informationswissenschaft
Open Access:Open Access
Lizenz (Deutsch):License LogoCreative Commons - Namensnennung