@phdthesis{Naether2009,
  type      = {Master Thesis},
  author    = {Axel N{\"a}ther},
  title     = {Schrifterkennung in Videobildern},
  url       = {https://nbn-resolving.org/urn:nbn:de:hbz:832-epub4-1857},
  year      = {2009},
  abstract  = {Fernseh- und Videobilder in Fernsehsendungen oder in digitalen Videoarchiven, aber beispielsweise auch auf Grafiken basierende Inhalte von Internetseiten enthalten eine gro{\"s}e Anzahl von in sie eingebetteten Texten. Die Lokalisierung und Erkennung dieser Texte er{\"o}ffnet eine Vielzahl von Anwendungsm{\"o}glichkeiten. So k{\"o}nnen Texte beispielsweise als Ergebnis der Suche und Verarbeitung von gro{\"s}en digitalen Videoarchiven mit Inhalten von Nachrichtensendungen oder Dokumentationen zum Erstellen von Datenbanken dienen. Da in Nachrichtensendungen sehr oft Einblendungen von Orten, Namen, Uhrzeiten oder sonstigen Informationen vorhanden sind, k{\"o}nnen diese Grundlage f{\"u}r Datenbanken werden, durch die sehr schnell auf einzelne Beitr{\"a}ge zugegriffen werden kann. Auch dienen diese Datenbanken der Verkn{\"u}pfung unterschiedlicher Inhalte von Beitr{\"a}gen miteinander. F{\"u}r Firmen die im Fernsehen Werbung schalten ist es von Interesse zu {\"u}berpr{\"u}fen, ob und gegebenenfalls wann der eigene Werbespot gesendet wurde. Auch hier w{\"a}re eine automatische Erkennung von Schriftz{\"u}gen wie beispielsweise des Produktnamens und die gleichzeitige Aufzeichnung der Uhrzeit und des Sendekanals von Interesse. Eine weitere Anwendung ist die Erkennung von Inhalten in Webseiten welche nicht textbasiert sind, also zum Beispiel in Flash oder {\"a}hnlichen Formaten vorliegen. Auf die in diesen Seiten hinterlegten Informationen k{\"o}nnen Standard-Suchmaschinen nicht zugreifen, weshalb die Informationen bei einer Suchanfrage nicht ber{\"u}cksichtigt werden. An diese Problem und die Anwendungsm{\"o}glichkeiten ankn{\"u}pfend, ist es das Ziel die ser Arbeit M{\"o}glichkeiten zur Erkennung von in Fernsehbildern eingebetteten Schriften, wie beispielsweise ”www.schrift-im-videobild.de” aufzuzeigen und als reinen ASCII-Text zu extrahieren. Dazu wurde eine Sammlung von verschiedenen Testbildern erstellt, die unterschiedliche von den Fernsehanstalten eingeblendete Texte enthalten. Dar{\"u}ber hinaus soll ein Programm mit Hilfe der Programmiersprache C++ erstellt werden, das die Testvorlagen f{\"u}r eine Texterkennung durch kommerzielle Optical Character Recognition (OCR) Software, wie sie f{\"u}r die Erkennung von reinen Bin{\"a}rbildern (zum Beispiel eingescannte Schreibmaschinentexte) genutzt wird, vorverarbeitet. Um dieses zu erreichen wurden M{\"o}glichkeiten untersucht, die im Bild enthaltenen Schriften zu detektieren, zu segmentieren und in einem weiteren Verarbeitungsschritt in ein neues Bild zu extrahieren, wobei das schlussendliche Bildresultat nach M{\"o}glichkeit nur noch schwarze Schrift vor wei{\"s}em Hintergrund enthalten soll.},
  language  = {de}
}