Zur rechten Zeit am rechten Ort

Motivation

Reale Ereignisse können so gut wie immer einem Zeitpunkt oder -raum sowie einem Ort zugewiesen werden. Ist man sich dieser Tatsache bewusst, können beispielsweise Berichte, Bilder und Videos sinnvoll gebündelt werden, indem man Informationen, die aus Inhalten und Metadaten gewonnen werden können, miteinander vergleicht.

Da die Entwicklung diesbezüglich in vielerlei Hinsicht noch am Anfang steht, gibt es viele Fragestellungen, die bisher kaum oder gar nicht untersucht wurden:

  • Auf welche Weisen können Inhalte miteinander verglichen werden?
  • Welche Faktoren sind beim Abgleich besonders wichtig?
  • Wie kann man den Grad der Ähnlichkeit messen?
  • Welches Vorgehen ist am sinnvollsten, um Ereignisse zusammenzufassen?
  • Wie ähnlich müssen sich Inhalte sein, um vom gleichen Ereignis sprechen zu können?
  • Welche gemeinsamen oder kombinierten Inhalte und Entitäten (Orte, Personen, Organisationen) kann man nutzen, um das zusammengefasste Ereignis zu beschreiben? Inwiefern funktionieren Vergleichsmethoden sprachübergreifend?
  • Unter welchen Bedingungen kann das Zusammenführen schwer oder unmöglich sein? usw.

In Zusammenarbeit mit der qompa GmbH, welche bei der Entwicklung der gleichnamigen Internetplattform nah an diesem Thema arbeitet, kann die Forschung auf den bisher gewonnenen Erkenntnissen aufbauen.

qompa ist ein soziales Netzwerk, in welchem es darum geht, automatisch und manuell erzeugte Ereignisse an Raum und Zeit zu binden und sie so für jeden leicht auffindbar zu machen. Die Nutzer können individuell nach Einträgen filtern und mit ihnen und ihren Autoren interagieren. Darüber hinaus spielt das Erstellen eigener Einträge und die Kommunikation der Nutzer untereinander eine wesentliche Rolle.

Ziele

Ziel dieser Arbeit ist ein Vergleich verschiedener Verfahren zum Messen der ereignisbezogenen Ähnlichkeit von Texten und anderen Inhalten von Webseiten (z.B. Metadaten), um verschiedene Quellen diesbezüglich identifizieren und gruppieren/zusammenfassen zu können. Insbesondere stehen dabei Qualität und Quantität der gewonnenen Gemeinsamkeiten in Relation zueinander im Fokus. Darüber hinaus gilt es herauszufinden, welche Bedingungen gegeben sein sollten, um eine Gruppierung von Ereignissen sinnvoll erscheinen zu lassen.

Aufgabe

Dazu sollen u.a. die folgenden Arbeitsschritte durchgeführt werden:

  • Literaturrecherche zu bestehenden Algorithmen und ähnlichen Vorgehensweisen
  • Analyse und Vergleich von unterschiedlich gearteten Quellen (Veranstaltungen, Nachrichten, Dokumentationen, Geschichten, Blogs, Wikipedia, …)
  • Konkretisierung und ggf. Ergänzung der Fragestellungen
  • Entwurf einer Anwendung zum Vergleich verschiedener Verfahren zum Messen der Ähnlichkeit und Beantwortung der Fragestellungen
  • Auswertung und Präsentation der Ergebnisse

Die o.g. Fragestellungen dienen dabei der Orientierung und können selbständig durch weitere ergänzt werden.

Wenn Sie Interesse am Umgang mit Web-Daten und -Technologien sowie gute Programmierkenntnisse (bevorzugt in Java oder Python) haben oder Interesse, sich diese anzueignen, dann melden Sie sich bei Robert Jäschke.