Weil man hier einem großes Thema gegenübersteht, das gleichermaßen mit praktischen, ästhetischen und gesellschaftlichen Fragen zu tun hat, sind diese flüchtigen Bemerkungen nur der Auftakt zu einer Reihe weiterer Texte zum Tema Sehr geehrte Damen und Herren, ich will Ihnen ein paar Gedanken zu dem sonderbaren Verhältnis darlegen, das unsere Zeitgenossen zur »Künstliche Intelligenz« unterhalten. Und das konfrontiert uns mit dem befremdlichen Umstand, dass dem eine fast religiöse Qualität innezuwohnen scheint – oder weswegen sonst taucht im der Rede darüber reflexhaft das Wortpaar »Fluch und Segen« auf? Damit das, was ich Ihnen jetzt sage, nicht vollständig abgehoben erscheint, lasse ich jetzt einfach ein paar Videoausschnitte nachfolgen, die wir auf dem ex nihilo Blog publiziert haben, im Zusammenspiel mit Dall-E und Google VEO, aber auch einer Software, die ich selber geschrieben habe. Diese Software ist insofern ziemlich ungewöhnlich, als sie klassische Essays, aber auch transkribierte Gespräche in visuelle Metaphern zurückübersetzt. Und weil unser Gehirn, genauer, weil unsere Sprache ein regelrechter Zauberkasten ist, erzeugen diese die verwegensten Bildkompositionen – Dinge, die ein noch so phantasiebegabter Mensch sich kaum einfallen ließe. Lassen Sie mich, während die Bilder an Ihnen vorüberlaufen, die Differenz in Worte fassen. Normalerweise sitzt man vor einem Prompt und sagt dem magischen Spiegel, was man zu sehen wünscht. Hier ist der Prozess ein ganz anderer. Ausgangsbasis ist ein geschriebener Text – oder ein transkribiertes Gespräch. Dann laufen mehrere Schritte ab. Die AI erstellt eine Zusammenfassung – und identifiziert darüber die Grundgedanken des Textes. Diese werden in Wortbilder übersetzt, also in Metaphern – und diese bilden die Bausteine, welche die AI dann in einen Prompt, also in eine Kompositionsanweisung übersetzt. Die Anweisungen werden gespeichert – und dann werden diese Bilder generiert. Die Ausgangsposition ist also nicht die frei flottierende Einbildungskraft, sondern ein mehr oder minder konsistenter Text – der ganz für sich alleine stehen will, ja, in seiner Entstehungsphase nicht einmal diesen Visualisierungsprozess antizipiert hat. Wenn wir den Begriff der Einbildungskraft nehmen, der ja einen unübersehbaren visuellen Einschlag besitzt, könnte man sagen, dass die visuelle Phantasie, auch wenn das Ganze am Ende in eine Form der Bildproduktion einmündet, hier gar keine Rolle spielt. Ausgangspunkt ist ein Gedankengerüst, ein Text, der versucht, den Leser in eine bestimmte Gedankenwelt hinein zu entführen. Das Kuriosum ist nun, dass diese Form der Text- und Gedankenlastigkeit gar keinen Nachteil darstellt. was ihrer Transformation in die Bilderwelt anbelangt. Ganz im Gegenteil: Wenn Walter Benjamin einmal festgehalten hat, dass ein Fotograf manche Dinge festhält, die sich ihm erst später, beim Entwickeln und Betrachten der Fotografie eröffnen – und wenn er dies ein „optisch Unbewusstes“ genannt hat –, so könnte man einen ganz analogen Vorgang hier festhalten. Denn der Autor des Textes wird, indem er erlebt, dass seine Sprachbilder eine Art Eigendynamik annehmen, mit einem „gedanklich Unbewussten“ konfrontiert - und je komplizierter und differenzierter Text ist, desto besser, vor allem überraschender sind die Resultate. Ich muss gestehen, dass mich dieser Prozess absolut fasziniert hat – umsomehr, als man sich hier in der Rolle eines Marcel Duchamp wiederfindet, der nicht mit einem Gebilde der eigenen Phantasie, sondern mit einem ready made konfrontiert ist. Man beschäftigt sich also gar nicht damit, irgendwelche Imaginationen auf den Schirm oder auf die Leinwand zu zaubern – sondern man schaut einfach bloß hin. Und aus diesem Grund besteht die entscheidende Aufgabe nicht in der Bildproduktion, sondern in der Selektion – und da ist man mit der Frage konfrontiert, warum dieses Bild die Phantasie anreizt, jenes aber nicht. Tatsächlich ermangelt es etwa drei Vierteln der resultierenden Bilder an einer solchen Qualität, sie mögen vielleicht ansprechend sein, aber sie berühren den Betrachter einfach nicht (was ja nach Baumgarten die eigentliche Aufgabe der Ästhetik ist, denn aisthesis meint ja ursprünglich berühren und wahrnehmen). Nach gut einem Jahr des Umgangs mit dieser Software muss ich gestehen, dass mich diese Form der Bildproduktion, die ja nachgerade so etwas wie eine Traumerzählung ist, weit mehr beschäftigt als alles, was man sich, wenn man denn vor einem leeren Prompt sitzt, so einfallen lässt. Denn letztlich kommt hier niemals mehr heraus, als was man sich zuvor hat einfallen lassen: garbage in, garbage out – oder wie Goethe das sehr viel eleganter gesagt hat: Man spürt die Absicht und man ist verstimmt. Wenn wir diesen Prozess auf seinen Materialwert abfragen, ist hier eine Umkehrung zu beobachten, die bemerkenswert ist. Wenn wir von Einbildungskraft sprechen, ja, wenn einige überaus verwegene Theoretiker der 90er Jahre sich einen visual turn zurechtgelegt haben, so ist zu sagen, dass die avancierte Bildproduktion längst die visuelle Sphäre verlassen hat – und uns zu Kopf gestiegen ist. Das ist deswegen bemerkenswert, weil wir hier der Rückkehr eines mittelalterlichen Zeichenbegriffes beiwohnen können. Denn damals war man der Meinung, dass ein Zeichen umso wertvoller sei, je näher es bei Gott ist – oder wie man heute sagen würde: je abstrakter es ist. Folglich galt der Gedanke als das wertvollste Zeichen, dann kam das gesprochene, dann das geschriebene Wort, erst dann das Bild und zuguterletzt die Spur, die man in der Welt hinterlässt. Das ändert sich mit der Renaissance, die nun tatsächlich jenen visual turn bewirkt hat, den die Kulturwissenschaftler der 90er mit großer Verspätung diagnostiziert haben – und da denkt Leonardo da Vinci darüber nach, dass die Musik die kleine Schwester der Malerei darstelle, einfach deswegen, weil sie verklingt, während die Malerei Werke von Ewigkeitswert in die Welt entlässt. Wenn wir heutzutage also behaupten, wir lebten in einer visuellen Kultur, dann mag das für große Bevölkerungsteile so aussehen – aber das gedankliche und ästhetische Triebwerk, das diese Welt speist, hat seine Gestalt gewandelt. Wenn die Traumfabrik Hollywoods sich vor kurzem in einen Streik hineinbegeben hat, so deswegen, weil die Fortschritte unserer Computerkultur wahrhaft grundstürzend sind. Man muss sich nur an einen der großen Historienschinken der 50 und 60er Jahre erinnern – wo ganze süditalienische Kleinstädte als Statisten rekrutiert wurden –, um sich den Unterschied vor Augen zu tagen. Denn heute stellt die CGI (d.h. die Computer Generated Imagery) dem Regisseur eine ganz Armada hyperrealistischer, gefügiger Akteure bereit. Und dieser Rationalitätsschock betrifft nicht nur die Statisten, sondern im gleichen Maße auch die Kulissen- und Bühnenbildner, ebenso wie die Musiker, die ein Bernard Hermann noch, in Gestalt eines ganzen Symphonierorchesters, ins Tonstudio gebeten hat. All dies wird nun von Leuten wie Hans Zimmer bewerkstelligt, oder von namenlosen CGI-Künstlern, welche die aberwitzigsten Dinge auf den Schirm zaubern. Womit das, was man ehedem ein Set genannt hat, nicht viel mehr ist als eine Halle, wo ein paar Schauspieler vor einem Greenscreen agieren. Nun betrifft die Rationalisierungsdrohung der künstlichen Intelligenz nicht nur die unmittelbare Aufnahmesituation, sondern auch die Postproduktion. Wenn man heutzutage nach Belieben Stimmen clonen kann, ja, wenn selbst Übersetzung und Synchronisation lippensynchron von einer AI bewerkstelligt werden können, so ist die grundstürzende Revolution der Traumfabrik fait accompli. Ich könnte nun, was die Veränderung unseres audiovisuellen Instrumentariums anbelangt, eine dystopische Suada anstimmen – und diese wäre insofern berechtigt, als die uns bevorstehenden Rationalitätsschübe wohl den ganzen Industriezweig in Mitleidenschaft ziehen. Aber genau das möchte ich nicht tun. Warum nicht? Nun – einfach deswegen, weil ich der Überzeugung bin, dass man es a) hier mit einer Unausweichlichkeit zu tun hat, und b) weil ich die ästhetischen und gedanklichen Möglichkeit, die sich mit dieser Welt auftun, persönlich ganz großartig finde. Das Dilemma, dem wir gegenüberstehen, ist vielmehr geistiger, wenn nicht philosophischer Natur, eine Demütigung, die all das übertrifft, was Sigmund Freud in seinem Unbehagen in der Kultur festgehalten hat. Denn da hat er, wie Sie vielleicht erinnern, drei geistige Demütigungen festgehalten: 1. die kopernikanische Wende, welche bewirkt hat, dass man sich nicht mehr als Zentrum der Welt fühlen kann, 2. die Darwinsche Evolutionsbiologie, die den anthropologischen Suprematismus fragwürdig gemacht hat, 3. das Unbewusste selbst, das dem Einzelnen klar macht, dass er nicht einmal im eigenen Denken heimisch sein kann, dass er nicht mehr Herr ist im eigenen Haus. Nun - halten wir uns vor Augen, dass diese Erschütterungen, als die auftraten, nur eine kleine Zahl von Menschen wirklich affiziert haben (die sogenannte Elite, wenn Sie so wollen), so haben wir es bei der digitalen Revolution mit einer sehr viel gravierenderen Situation zu tun: denn sie zieht jeden, aber auch wirklich jeden Menschen auf dieser Welt in Mitleidenschaft. Das Dilemma, dem wir heute gegenüberstehen, lässt sich mit am ehesten mit dem vergleichen, was Günter Anders einmal treffend die prometheische Scham genannt hat – und was man als eine Form der Schizophrenie auffassen kann: Ich bin’s, aber ich bin’s nicht gewesen. Wenn Blaise Pascal einmal gesagt hat, das ganze Unglück des Menschen rühre daher, dass der Mensch nicht ruhig in seinem Zimmer bleiben könne, so ist evident, dass der vernetzte Mensch per se ein Sozius, ein Gesellschaftstier ist – oder wie ich das formulieren würde: ein Dividuum, das sich an seiner Teilbarkeit und an seinem Mitteilungsdrang erh