Volltext-Downloads (blau) und Frontdoor-Views (grau)
The search result changed since you submitted your search request. Documents might be displayed in a different sort order.
  • search hit 80 of 474
Back to Result List

Text Extraction und Semantic Web am Beispiel von Marktstudien

  • Das Erstellen von Textzusammenfassungen ist bei Recherchearbeiten die gängigste Praxis, um einem Text seine Kernaussage zu entnehmen. Aus einer Zusammenfassung leitet man die essenzielle Information ab, mit dem Ziel, einen Text einem Themengebiet zuzuordnen. Dem Benutzer hilft hierbei ein software-gestütztes System zur Textzusammenfassung. Texte beinhalten aus Sicht eines Computersystems eine Aneinanderreihung von Wörtern bzw. Sätzen und besitzen demnach keine feste Struktur. Aus den unstrukturierten Daten im Text müssen Wörter extrahiert werden, die den Kerninhalt eines Textes widerspiegeln. Auf Basis der extrahierten Wörter erfolgt die endgültige Zusammenfassung und anschließend die semantische Auszeichnung des Gesamttextes, was der Themengebietszuordnung entspricht. Bewährte Methoden für die Textzusammenfassung sind das statistische Verfahren und das sogenannte Signalwort-Verfahren. Grundlage dafür sind die theoretischen Arbeiten von H. P. Luhn und Edmundson. Als weitere Hilfsmittel dienen statistische Methoden aus dem Text Mining. Für die Zuordnung des Textes zu einem Themengebiet eignen sich die Semantic Web Standards des W3C. Der auf Basis dieser Theorien entwickelte Lösungsweg dient als Standardverfahren für eine software-gestützte Textzusammenfassung. Durch die definierten Standards ist die Software in der Lage, jegliche Textarten aus beliebiger Quelle einzulesen, zusammenzufassen und semantisch auszuzeichnen. Benutzer, deren Aufgabe im Unternehmen darin besteht, Recherchearbeiten zu betreiben, verwenden diese software-gestützte Textzusammenfassung. Durch diese Unterstützung spart der Benutzer bei einer Zusammenfassung von mehreren Textdaten Zeit und Aufwand, da der Vorgang durch die Software automatisch abläuft. Aus Sicht eines Unternehmens liegt das Hauptaugenmerk auf der schnellen Informationsgewinnung aus Texten, was essenziell für eine Weiterverarbeitung der Textdaten ist.
  • Creating a text summary is a common practice in the research field for withdrawing the main quintessence of the text. From the text summary the main information will be derived in order to assign the text to a topic. A software based solution for Text-Summarization supports the user to achieve the goal. From the computersystems’ point of view, texts contain a series of words and sentences respectively, thus texts do not have a certain structure, which means texts are more or less unstructured. Words have to be extracted from this unstructured data, which reflects the core content of the text. Based on this extracted words follows the summarization and after that the semantic annotation of the text, which is simmilar to the assignment of the text to a topic. The two main methods for Text-Summarization are the statististical procedure and the so-called Cue-Word-Method. The basic principles for these methods are based on the theoretical works of H. P. Luhn and Edmundson. Additionaly statistical methods from the Text Mining field also support the Text-Summarization. The proposals of the Semantic Web standards by the W3C will be used to assign a text to a topic. The developed solution, which is based on the theoretical proposals is used as a standard procedure for a software based Text-Summarization. By defining these standards the software is capable to read, summarize and annotate any form of text from any source. Users who are specialized in conducting text summaries in a company use this softwarebased Text-Summarization. By supporting the user on the summarization process, time and effort are saved, since the Text-Summarization procedure is automated. From the companies’ point of view the main focus lies on the fast and rapid information extraction of texts, which is essential for further data processing.

Download full text files

Export metadata

Additional Services

Search Google Scholar

Statistics

frontdoor_oas
Metadaten
Author:Egy Rizky Utama Ridwan
URN:urn:nbn:de:101:1-201011123151
Year of Completion:2010
Document Type:Master's Thesis
Language:German
Publishing Institution:Hochschulbibliothek der Technischen Hochschule Köln
Date of Publication (online):2010/10/04
GND-Keyword:Kategorisierung; OWL <Informatik>; Semantic Web
Tag:Automatische Kategorisierung; Automatische Text-Extraktion
Institutes:Informatik und Ingenieurwissenschaften (F10) / Fakultät 10 / Institut für Informatik
Dewey Decimal Classification:000 Allgemeines, Informatik, Informationswissenschaft / 000 Allgemeines, Wissenschaft / 004 Informatik
Open Access:Open Access