Wie Wissen zugänglich wird

Ein Archiv mit tausenden Artikeln und unzähligen Informationen – das ist ein Schatz, über den die mgo verfügt. Auch in anderen Medienhäusern sammelt sich über die Jahre umfassendes Wissen zu Namen, Ereignissen, Geschichten, Beobachtungen und bestimmten Personen an. Trotzdem ist es heute oft immer noch sehr umständlich, diese Schätze zugänglich zu machen und so redaktionelle Arbeitsabläufe zu optimieren. Täglich könnten Redakteurinnen und Redakteure während ihrer Recherchearbeit von Informationen aus bereits geschriebenen Artikeln noch mehr profitieren.

Doch Fakt ist: In einem riesigen Archiv nach Andreas Starkes Meinung zum Klimaschutz von vor 12 Jahren zu suchen, dauert heute ziemlich lange. Man müsste einzelne Artikel heraussuchen, die enthaltenen Informationen abgleichen und zwischen den Zeilen lesen, bis sich dann nach und nach ein Bild ergibt. Diese Herangehensweise würde eine Vielzahl von Suchmasken mit spezifischen Suchparametern benötigen. Das manuelle Sichten und Sammeln aller Ergebnisse kostet sehr viel Zeit und ist so im stressigen Redaktionsalltag nicht immer umsetzbar.

Das Accelerator-Team hedwig entwickelt Wissensgraphen

Aber das muss nicht mehr lange so sein! Vier Studierende der Universität Bamberg haben sich der Problematik angenommen und gemeinsam einen innovativen Lösungsansatz entwickelt. Unter dem Namen „hedwig“ möchten sie diesen auf den Markt bringen. Anna Sauer, Lukas Schwarz, Marco Lehner und Christopher Schmidt studieren „Computing in the Humanities“ und tüfteln nebenbei an verschiedenen Technologien und Softwaresystemen aus dem Bereich des Wissensmanagements. Im Rahmen eines Ideenstipendiums wird die Arbeitsgruppe dabei von der mgo unterstützt. Michael Grün, BWL-Student an der Universität Bamberg, hilft dem Team bei kaufmännischen Themen rund um Markt, Wettbewerb, Geschäftsmodelle und weitere Förderprogramme.

Als externes Team des mgo Launchpads sitzen die Studierenden zusammen mit Hello Bamberg und inFranken.de am Standort Bamberg in der Langen Straße. Betreut wird das Team von Accelerator-Manager Maximilian Grimmer, der mit Rat und Tat zur Seite steht. Er hilft ihm bei der methodischen und nutzerzentrierten Produktentwicklung. Zusätzlich unterstützt Christoph Beckmann, Teamleiter im Produktmanagement bei inFranken.de, auf technischer Seite. Bis zum Ende des Jahres soll ein erster Prototyp eines Wissensgraphen nutzbar sein.

Innovative Sprachtechnologien im Redaktionsalltag nutzen

„Das Projekt ist zwar IT-getrieben, aber dennoch sehr nah an dem, was unsere Redakteurinnen und Redakteure jeden Tag tun. Es geht darum, über verschiedene Artikel verstreute Informationen zu bestimmten Schlagwörtern oder Fragestellungen zu bündeln und als Ressourcen unseres Hauses nutzbar zu machen“, erklärt Maximilian Grimmer. Graph-Technologien gelten als moderne Methode einer intelligenten Datenspeicherung. Sie können hochkomplexe Beziehungen zwischen Informationen darstellen.

Diese Informationen aus allen Texten des Archivs werden über sogenannte Knoten und Kanten zusammengeführt. Die Knoten stellen Dinge, Orte oder Menschen dar, die Kanten die Beziehungen zwischen diesen. So entsteht ein Netzwerk nützlicher Informationen für den Endverbraucher. Im redaktionellen Alltag kann der Wissensgraph so den Arbeitsablauf während einer Recherche erheblich erleichtern. In wenigen Sekunden könnte man  beispielsweise mehr als 2 Millionen Zeitungs- sowie inFranken.de-Artikel durchsuchen, um alle Zitate von Andreas Starke bezogen auf den Klimawandel zu erhalten.

Software mit hohem Nutzwert

Anders als eine gewöhnliche Freitextsuche kann der Wissensgraph also nicht nur einzelne Namen oder Wörter finden, sondern sogar ausführliche Steckbriefe erstellen oder komplexe Fragestellungen beantworten. Derzeit entwickelt das Team verschiedene Software-Prototypen, die mit der Unterstützung unserer Lokal- und Zentralredaktionen sowie Mitarbeitenden von inFranken.de auf ihre praktische Eignung im redaktionellen Arbeitsfluss getestet werden.

Dabei leistet hedwig wichtige Forschungsarbeit. „Große Player wie Wikipedia arbeiten zwar schon lange mit Wissensgraphen, diese werden aber händisch modelliert. Wir versuchen, als eines der ersten Teams, deutsche Sätze vollautomatisch in einen Graphen zu überführen“, erklärt Christopher Schmidt. Die Studierenden bauen selbst einzelne Software-Elemente, die zwar im Englischen schon existieren, aber abgestimmt auf die deutsche Sprache noch nicht programmiert wurden.

Die mgo auf dem Weg in die Zukunft

Durch die Arbeit im innovativen Umfeld der mgo kann sich das junge Team an realistischen Problemstellungen in einer Redaktion orientieren und seinen Wissensgraphen auf den praktischen Gebrauch abstimmen. „Uns als Medienhaus ermöglicht dieses Projekt nicht nur direkten Zugang zu innovativen Zukunftstechnologien – vielmehr können wir die technische Zukunft der Medienbranche sogar aktiv mitgestalten“, so Maximilian Grimmer von mgo Launchpad.

Sie haben Fragen, Anregungen oder Feedback zum „Projekt Wissensgraph“ oder Lust beim Testen der Prototypen zu helfen? Sie können sich gerne auf der Webseite hedwig.cc weiter in das Projekt einlesen. Das Team hedwig freut sich zudem jederzeit über Nachrichten an team@hedwig.cc.

Text: Emma Rölling
Bild: Valerie von Raven