-
German
Lightning Talk
Intermediate
Textmining und interaktives maschinelles Lernen für den Journalismus der Zukunft

Short thesis

Am Anfang standen Fragen wie: Schreiben Lobbyisten tatsächlich die Gesetze, wenn es darum geht, den Datenschutz aufzuweichen – und wenn ja: in welcher Form? Wer treibt die Verschärfung von Sicherheitsgesetzen voran und will die Freiheit im Netz einschränken – wer zieht die Strippen im Hintergrund? Jetzt entwickeln wir Prototypen für ein datenjournalistisches Tool für solche investigativen Recherchen. Textmining und interaktives maschinellens Lernen für den Journalismus der Zukunft!

Description

Unser Tool „DebateExplorer“ soll gerade in Zeiten knapper Mittel im Journalismus dafür sorgen, dass investigative Recherche nicht nur den großen Verlagen vorbehalten bleibt oder angesichts des Aufwands ganz ausstirbt. Wir wollen die Texte im Netz nutzen (wie Bundestagsdebatten, Interviews, Artikel, Strategiepapiere), um mittels automatischer Texterkennung aufzudecken, wie Debatten beeinflusst werden. Die Herausforderung dabei: die Algorithmen sollen nicht nur wortgleiche Passagen finden, sondern auch inhaltliche Gemeinsamkeiten, die verschieden formuliert sind. Dafür trainieren wir sie gemeinsam: JournalistInnen und ComputerlinguistInnen. Einer unserer ersten Anwendungsfälle könnte zeigen, wer daran arbeitet, das Netz immer unfreier zu machen. Wer argumentiert für Hintertüren für Geheimdienste, wer gegen Verschlüsselung und gegen Anonymität im Netz? Und vorallem, warum: kommerzielle Interessen, Bestechung, Vetterleswirtschaft etc. Welche Lobbyisten reden mit und wie erfolgreich sind sie, welche Politiker lassen sich bestechen oder von Interessensgruppen manipulieren? Die Algorithmen bringen uns auf die richtige Spur, identifizieren auffällige Gemeinsamkeiten, Gleichzeitigkeiten, Verflechtungen. JournalistInnen recherchieren nach, konfrontieren und decken auf. Es ist nicht einfach, den Maschinen ein Verständnis menschlicher Sprache nahe zu bringen. Aber wir sind überzeugt, dass das Team Hirn und Algorithmus unschlagbar ist und den investigativen Journalismus vorantreibt. Das Projekt Debate Explorer ist aus mehr als 80 Bewerbungen für das Programm „Wissenschaft und Datenjournalismus“ der Volkswagenstiftung ausgewählt worden und wird von Januar bis September 2016 gefördert. Unsere Tools werden nach Projektende allen Interessierten zur Verfügung stehen. Jetzt könnt ihr mitgestalten: Zur Projektmitte präsentieren wir euch den Stand unserer Arbeit und freuen uns über Erfahrungsaustausch, Anregungen, Diskussionen, Kritik und Wünsche!