Riesensprünge in den Anwendungsgebieten künstlicher Intelligenz werfen Fragen nach Kreativität, Originalität und Wahrheit auf.
Titelbild: Anhand von Stichwörtern des Autors per KI erstellte Bilder: »Jesus arguing on the phone renaissance painting« und »artist talking with LCD monitor renaissance«. (Credit: Rainer Sigl)
Seit letztem Sommer herrscht Aufregung in der Kreativbranche: Eine ganze Palette an KI-Angeboten wie Dall-E, Stable Diffusion und Midjourney verblüfft die Welt mit computergenerierter Kunst, wie es sie zuvor noch nicht gegeben hat. Bei der Text-to-Image-Generation (T2I) wird ein »Prompt« aus Stichwörtern (»woman with headphones«), Angaben zu Stil und Kunstrichtung (»painting«, »photograph«) und sogar Vorbild (»by Gustav Klimt«, »inspired by Picasso«) zu einem durch die KI generierten neuen Kunstwerk.
Die Resultate reichen von seltsam verstörenden Collagen zu perfekt ausgeleuchteten Fake-Fotos, von großartig unwahrscheinlichen Stilmischungen bis hin zu täuschend echten Beinahe-Fälschungen. Seit den ersten öffentlich zugänglichen Prototypen vor einigen Monaten haben sich Millionen Menschen an den immer weiter verfeinerten Kreativspielzeugen versucht. Vonseiten der Kreativbranche wurde der Vorstoß der Algorithmen ins kreative Feld als feindliche Handlung interpretiert; nicht zu Unrecht.
In den gewaltigen Bilddatenbanken, auf denen die Outputs von Dall-E, Midjourney & Co beruhen, liegen Millionen von Bildern, die ohne Wissen oder Zustimmung ihrer eigentlichen Urheber verwendet wurden. Somit nimmt im schlimmsten Fall ein Programm, das ohne deren Wissen mit Bildern einer bestimmten Künstlerin X trainiert wurde, just derselben die Arbeit weg, weil die KI nun Bilder »in the style of X« ausspuckt; nicht nur ein moralisches, sondern ein rechtliches Graugebiet.
Reden mit der Maschine
Vor kurzem folgte eine weitere Hiobsbotschaft: ChatGPT, eine Konversationsschnittstelle für das AI-System GPT-3.5 von OpenAI, ist ein AI-Chatbot, der auf den ersten Blick schier Unglaubliches leistet. Das Programm beantwortet Fragen in täuschend perfekter Form, generiert in Sekundenschnelle kurze Aufsätze, Gedichte und sogar Programmcode-Schnipsel. Erste aufgeregte Kritiker*innen sahen das Ende des kreativen und/oder wissenschaftlichen Schreibens, aller möglichen schreibenden Berufe, zumindest von Hausübungen, vielleicht aber sogar des Internets als nutzbare Informationsquelle gekommen.
Bei nur etwas näherer Betrachtung zeigten sich die Texte, die ChatGPT ausspuckt, eher als gute, aber letztlich rein oberflächliche Mimikry. Mit den Fakten nimmt es die AI nicht so genau, der Fokus lag stets nur auf einer oberflächlichen Ähnlichkeit zu plausiblen, »echten« Antworten. Genauso wie die Bilder der T2I-Generatoren nur oberflächliche Ähnlichkeit zu Millionen optisch verwandten Datenpunkten liefern, sind die Texte, die die AI (bislang) zustande bringt, eher so etwas wie täuschend echt aussehender Blindtext, der inhaltlich entweder banal und an der Oberfläche bleibt oder gleich nur geschickt verkleideten Unsinn produziert. Bei Bildern mag diese oberflächliche Ähnlichkeit manchmal ausreichen; bei Texten liegt die Hürde zur Verwendbarkeit ein bedeutendes bisschen höher.
Schlechte Nachrichten für Künstler*innen, Entwarnung für die schreibende Zunft? So einfach ist es nicht. AI ist ein Tool, das noch einige Zeit menschliche Lenkung benötigen wird; wie bei Synthesizern und Fotografie wird ihr Einsatz eine Reihe von Nischen ordentlich umkrempeln. Vielleicht steigt durch ihren Einsatz aber letztlich sogar der Wert menschlicher »Handarbeit« oberhalb einer gewissen Qualitätsmarke. Bis dahin gilt: Aufmerksamkeit und kritischer Blick auf Bild und Text zahlen sich aus – ab jetzt sogar noch ein wenig mehr.