@phdthesis{Ruthmann2015, type = {Master Thesis}, author = {Kevin Ruthmann}, title = {Entwicklung eines Systems zur automatisierten Extraktion von Metadaten und dessen prototypische Anwendung innerhalb des Cloud-Speichers OX Drive}, url = {https://nbn-resolving.org/urn:nbn:de:hbz:832-epub4-7223}, year = {2015}, abstract = {Die Menge an Informationen steigt seit Jahren immer weiter an. Dies l{\"a}sst sich auch leicht an der Entwicklung der Speichermedien feststellen. So bot die erste 5,25-Zoll Festplatte, eine Seagate ST- 506, lediglich 5 MB Speicherkapazit{\"a}t. Heutige 3,5-Zoll Festplatten verf{\"u}gen hingegen {\"u}ber bis zu 8 TB Speicherkapazit{\"a}t und werden ebenso ausgenutzt wie ihre Vorg{\"a}nger aus der Anfangszeit der Magnet-festplatten. Zus{\"a}tzlich geht die Tendenz dorthin, alle Daten jederzeit zur Verf{\"u}gung zu haben. Sei es daheim am Rechner, auf der Arbeit oder per Tablet oder Smartphone unterwegs, dank der immer mehr verbreiteten Cloud-Speicher stehen die Daten jederzeit zur Verf{\"u}gung. Mit dem enormen Zuwachs an Dateien und auch an Dateiformaten wird es jedoch immer schwieriger, diese Masse zu {\"u}berblicken und bestimmte Inhalte in annehmbarer Zeit wiederzufinden. Beispiels- weise hostet der Internetdienst Flikr die schier un{\"u}berschaubare Menge von {\"u}ber 6 Milliarden Bilder. Doch nicht nur die gro{\"s}en Servicedienstleister besitzen gro{\"s}e Datenmengen, auch Einzelpersonen haben derweil gro{\"s}e Musik- und Bildsammlungen, zumal jedes aktuelle Smartphone {\"u}ber eine Kamera verf{\"u}gt. Jeder ist somit praktisch zu jeder Zeit in der Lage, ein Foto in hochaufl{\"o}sender Qualit{\"a}t zu schie{\"s}en und direkt in seine Cloud hochzuladen. Diese Datenmengen manuell zu ordnen, erfordert einen sehr hohen Aufwand, den nicht alle Menschen gewillt sind zu leisten. Vor allem am Smartphone geht dieses Benennen und Einsortieren aufgrund der vorhandenen Technik nicht so leicht von der Hand. In der Praxis sammeln sich die Aufnahmen mit der Zeit immer weiter an und letztlich befinden sich mehrere hundert wenn nicht gar tausend Bilder in einem Ordner, welche sich namentlich meist nur durch eine fort- laufende Nummer unterscheiden. Diesen Umstand Rechnung tragend, treten Metainfor-mationen immer mehr in den Vordergrund. So speichern die zuvor genannten mobilen Allesk{\"o}nner meist viele informative Daten mit in den Bilddateien ab. Beispielsweise kann dank der eingebauten GPS-Module der Ort der Aufnahme aus den Bildern ausgelesen werden. Die Dienstleister f{\"u}r Cloud-speicher nutzen diese Informationen jedoch nur marginal aus und bieten dem Endanwender kaum Unterst{\"u}tzung bei der Suche nach be- stimmten Inhalten, wie etwa beim OX Drive, der Cloudl{\"o}sung der Firma Open-Xchange. Die vorliegende Master Thesis zeigt, wie dieser Cloud-Speicher, welcher in die Hauseigene OX App Suite integriert ist, um sogenannte Smartfeatures erweitert werden kann. Diese Smartfeatures sollen dem Endan-wender helfen, die Daten einfacher – wenn nicht gar automatisch – zu ordnen und somit leichter bestimmte Inhalte wiederzufinden. Kernthema dieser Arbeit ist daher die auto- matische Extraktion von unterschiedlichen Metadaten aus diversen Dateiformaten. Des Weiteren wird gezeigt, wie diese Daten effizient gespeichert und abgefragt werden k{\"o}nnen. Die Thesis stellt hierzu den Document Store Elasticsearch vor und vergleicht diesen mit seinem Konkurrenten Apache Solr.}, language = {de} }