#rp23 Keynote-Sprecher Björn Ommer: Was es bedeutet, Computern das „Sehen“ beizubringen.

19.04.2023 - Björn hat „Stable Diffusion“ mitentwickelt. Trotz der großen transformativen Kraft generativer KI fordert er einen kritischen Dialog.
Image
Björn Ommer im Anzug vor einer weißen Wandtafel
Foto
Fabian Helmich / LMU

Björn Ommer bringt gemeinsam mit seiner Forschungsgruppe Computern das „Sehen“ bei – die Rechenmaschinen sollen unsere Welt verstehen und daraus lernen, indem sie sie einfach nur beobachten. Obwohl echtes Bildverständnis noch ein ehrgeiziges Ziel ist, stellte seine Forschung bereits ihre große transformative Kraft unter Beweis: Kürzlich hat die Forschungsgruppe um Björn eine generative KI mit dem Namen „Stable Diffusion“ veröffentlicht. Das KI-Modell soll die Erstellung visueller Inhalte demokratisieren und neue Wege in Kunst, Medien, Unterhaltung und darüber hinaus eröffnen. 

Die Vorstellung, was in Zukunft mit verbesserter Unterstützung durch Computer möglich ist, wenn KI diese zu leistungsfähigeren und zugleich leichter zugänglichen Werkzeugen gemacht hat, fasziniert Björn besonders. Gleichzeitig sieht er auch einen großen Bedarf an einem öffentlichen Dialog darüber, wie wir diese leistungsstarke Technologie als Gesellschaft annehmen können, um gleichzeitig den Nutzen zu maximieren und die Risiken zu minimieren.

​​Björn Ommer ist Professor an der Universität München, wo er die „Computer Vision & Learning”-Forschungsgruppe leitet. Zuvor war er ordentlicher Professor an der Fakultät für Mathematik und Informatik der Universität Heidelberg. Er erwarb sein Diplom in Informatik an der Universität Bonn und seinen Doktortitel an der ETH Zürich. Danach war er Postdoc an der UC Berkeley.

Auf der #rp23 freuen wir uns auf Björns faszinierende Einblicke in den Bereich von KI und Computer Vision.

____________________________________________________________________________

Ein Interview mit Björn Ommer.

Generative KI erscheint vielen gerade als große Revolution. Aber ist sie das auch?

Ja, wir sehen im Gegensatz zu früheren Hypes um KI, dass diese nun viele Anwendungen transformiert und dadurch neue Technologien ermöglicht werden. Lauffähige Prototypen werden von vielen Millionen Menschen bereits genutzt. Auch wenn diese noch sehr viel Verbesserungspotenzial besitzen, so stellen sie bereits jetzt für viele einen Mehrwert dar.

Welche Fragen sollten wir uns als Gesellschaft stellen, wenn wir über (generative) KI sprechen?

Es handelt sich um eine sehr leistungsfähige Technologie mit großem Potenzial – als Ermöglicher für weitere Technologien, aber auch mit der Möglichkeit der negativen Verwendung. Ihre Entwicklung vollzieht sich weltweit und wird deshalb schwerlich aufhören. Wir brauchen deshalb eine breite öffentliche Diskussion, wie wir generative KI zukünftig nutzen wollen – und wie nicht.

Das von dir mitentwickelte „Stable Diffusion“ ist Open Source. Warum sind du und dein Team diesen Schritt gegangen?

Die Entwicklung von generativer KI wird weltweit insbesondere von großen Firmen vorangetrieben. Außerdem waren die Modelle bisher so rechenaufwendig, dass ihre Anwendung und Weiterentwicklung zunehmend auf wenige große Firmen mit großen Rechenzentren beschränkt schien. Gleichzeitig war die Technologie im vergangenen Jahr, als wir „Stable Diffusion“ veröffentlicht hatten, qualitativ noch nicht so weit, dass die generierten Bilder gemeinhin als real angesehen werden konnten. Dementsprechend schien dies der geeignete Zeitpunkt, um die Forschung an dieser Technologie zu demokratisieren und gleichzeitig die breite Masse für ihren Einsatz und dessen Konsequenzen zu sensibilisieren.