Von der Sprache zum Bild

Dokumentarische Promptografie: Eine KI Fotoserie über Helga Paris

Die Bildsprache von Helga Paris

In der ersten Aufgabe sollten wir eine Fotoserie über eine bekannte Fotografin erstellen, die von künstlicher Intelligenz generiert wird. Da ich davon ausgehen wollte, dass die KI, wie Midjourney, Dall-E usw., die Künstlerin kennt bzw. Bilder von ihr verschlagwortet sind, habe ich zunächst ChatGPT gefragt, welche bekannten Fotografinnen es in Deutschland vorschlägt. Aus der Auswahl habe ich mich dann für Helga Paris entschieden, die für ihre authentische schwarz-weiß Dokumentarfotografie aus der DDR bekannt ist. Da ich mich bisher nicht intensiv mit der Künstlerin auseinandergesetzt hatte, musste ich ihre Arbeiten zunächst selbst studieren, um ihre Bildsprache in Worte und später auch in Prompts zu übersetzen. Die Frage lautete also: Was zeichnet die Bildsprache von Helga Paris aus? Auch hier habe ich ChatGPT nach den Adjektiven befragt:

Authentisch
Dokumentarisch
Emotional
Intim
Sozial engagiert
Einfühlsam
Zeitgenössisch
Realistisch
Geschichtsträchtig
Menschlich

Die Herausforderung von authentischer Fotografie mit KI

Schnell wurde mir bewusst, dass all diese Adjektive vielleicht die Art und Weise und Emotionen, die bei der Betrachtung der Fotografien entstehen, beschreiben, diese sich allerdings nicht gut dafür eignen, ein Bild zu generieren, weil sie sich nicht auf den Inhalt beziehen. Ich könnte sie also maximal als stilistische Parameter einsetzen. Sie zeigen mir aber schon schnell, wo die Herausforderung liegt, nämlich darin, etwas Intimes, Authentisches, Einfühlsames einer Fotografie einzuverleiben, die von etwas geschaffen wird, was kein Bewusstsein hat, kein Einfühlungsvermögen und nichts Geringeres macht als aus Text Bilder zu generieren, indem mit einem Generator Rauschen erzeugt wird und darin Muster nach dem Text probabilistisch erkannt werden (Diffusion Model) und ein Diskriminator, der versucht zwischen generierten und echten Bild zu unterscheiden (GAN). Durch diesen iterativen Wettstreit gegeneinander verbessert sich das System, sodass täuschend echte Bilder erzeugt werden.

Kann auch der fotografische Duktus täuschend echt, gar authentisch reproduziert oder gar geklont werden? Was bedeutet überhaupt echt und authentisch? Handelt es sich auch hierbei um eine Art Turing-Test, dass das Ergebnis dann gelungen ist, wenn ein Mensch die fotografische Arbeit eines Menschen, in meinem Fall Helga Paris, nicht mehr von den generierten Bildern einer KI unterscheiden kann?

Was zeichnet die Arbeit von Helga Paris aus?

Nachdem ich mir ein paar Bilder angeschaut habe, bemerkte ich, dass die Bilder von Helga Paris alle nicht lange geplant oder inszeniert waren. Es sind gewöhnliche Bilder von Menschen bei der Arbeit und Kindern, die gerade spielen. Die Menschen werden dennoch oft porträtiert, also in Szene und oft in die Mitte des Bildes gesetzt vor einem Hintergrund, der schlicht, unscharf ist, auf einem Arbeitsplatz, der Straße oder vor einer Wand. Es wirkt wie eine halbe Momentaufnahme, als hätte sie die abgelichteten Menschen kurz davor gefragt:

„Hey du, ich möchte dich jetzt fotografieren, stell dich mal da eben hin.“

und schon ist der Auslöser gedrückt. Also inszeniert, und gleichzeitig der Person nicht genug Zeit gegeben, um aus ihrer eigenen Rolle zu fallen und sich zu verstellen oder die Miene zu verziehen. Die vielen halbnahen Porträts von Harris zeigen einen sehr gleichgültigen Gesichtsausdruck, der weder Freude noch große Trauer zeigt. Dennoch wirken die Personen nicht „tot“ oder charakterlos, sondern geschafft und von dem sozialisitschen System entkräftet. Sie hat nicht nur den Verfall der Innenstädte wie in Halle deutlich gemacht, sondern teilweise auch den inneren Verfall von Menschen, der sich im Äußeren porträtiert.

Das, was ich jetzt hier beschrieben habe, kann ich Midjourney schwer erklären. Das ist zu viel Kontext und zu wenig Inhalt. Um mit Midjourney zu sprechen, braucht man vor allem Schlagworte, denn alle antrainierten Bilder wurden auch mal verschlagwortet. Mir wurde auch schnell bewusst, dass die Datenbank, die bei Midjourney zugrunde liegt, nicht wirklich mit vielen Bildern von Helga Paris trainiert wurde, obwohl sie der Akademie der Künste ein Archiv von 230.000 Negativen¹, die wie ich annehme noch nicht alle digitalisiert wurden. Könnte man auf dieses Bildarchiv zugreifen, dann wüsste Midjourney wahrscheinlich deutlich genauer, was die Fotografien von Helga Paris ausmachen. Es gab auch keinen besonders großen Unterschied, wenn ich by/of/in the style of Helga Paris dazu geschrieben oder weggelassen habe. Für mich bestand also die Aufgabe darin, den Stil von Helga Paris samt den Bildinhalten zu verschlagworten und mich auf ihre stilistische Bildsprache zu konzentrieren.

https://www.nd-aktuell.de/artikel/1128286.berliner-akademie-der-kuenste-alltag-als-transit.html ↩︎

Der schwarze Schwan

Ich bin nach der Wende in Westdeutschland geboren, und es war für mich natürlich äußerst schwierig, die Bilder nach Fakten und geschichtlicher Korrektheit zu bewerten, da ich mit vielen Details nicht vertraut bin und mich wahrscheinlich selbst an Ostklischees bediene. Ich wäre demnach kein guter Diskriminator, um der KI zu sagen, dass das Dargestellte nicht real genug ist. Auch ohne Expertise konnte ich in einigen Fällen durchaus kritisch sein, ob das Auto dort auf den Bild wirklich ein Trabant ist. (Die sahen doch alle gleich aus oder?). Dort bemerkte ich, dass Midjourney es nicht so genau nimmt mit manchen Details. Es generierte mir eher so durchschnittliche 70er Jahre Autos. Der Durchschnitt scheint Midjourney insgesamt zu bestimmen, weil die Ergebnisse eben aus vielen Daten generiert und am Ende durch Wahrscheinlichkeitsrechnung synthetisiert werden. Leichter als in der Realität kann man in Midjourney „den schwarzen Schwan“¹ finden. Man kann sich dort auch Schwäne in jeder Farbe problemlos generieren. Ein empirisches Induktionsproblem sollte sich daraus also nicht ergeben. Allerdings gibt es nicht die meisten und vor allem keine guten Ergebnisse von schwarzen Schwänen aus der Top-Down-Perspektive.

Beispiel zur Veranschaulichung des Induktionsproblems: Die Annahme, dass alle Schwäne weiß sind, kann durch Einzelfälle nicht endgültig für die Allgemeinheit bewiesen werden (Induktion) – eine Thematik, die von Denkern wie John Stuart Mill und Karl R. Popper diskutiert wurde. Diese Problematik wird auch im gleichnamigen Buch von 2007 des Publizisten Nassim Nicholas Taleb behandelt. ↩︎

a black swan from top-down perspective

birdy.ra_a_black_swan_from_a_topdown_perspective_36409fba-49d4-4127-8fc6-076307b6cec6.png

Der Hals ist perspektivisch nicht wirklich überzeugend. Es gibt scheinbar nur wenig Aufnahmen eines Schwans von oben auf die die Datenbank von Midjourney zurückgreifen kann.

Ähnlich wie mit den Schwierigkeiten mit Fingern scheinen unpopuläre Stellungen und Perspektiven aus dem durchschnittlichen Raster zu fallen, und es ist auch umso schwieriger, dort passende Ergebnisse zu erzielen. In diesem Fall sprechen wir von Bias, einer Verzerrung oder Vorurteil durch eine geringe oder falsche Abbildung der gesamten objektiven Realität. Auf dieses Problem, bezogen auf menschliche Hauttypen und die daraus resultierende Diskriminierung dunkelhäutiger Menschen, macht z.B. auch die Studie Gender Shades aufmerksam.¹

https://proceedings.mlr.press/v81/buolamwini18a/buolamwini18a.pdf ↩︎

Das Mittelmaß finden

Es sollte für mich also ein leichtes Spiel sein, durchschnittliche Menschenleben in der DDR mit einem durchschnittlichen Gesichtsausdruck mit einer KI, die eher dazu tendiert, die populärsten oder durchschnittlichsten Ergebnisse zu generieren, darzustellen. Das war eine Fehlannahme. Die Phrase „Garbage in, garbage out“ bedeutet auch so viel wie „Du bist, was du isst.“ oder auf die KI bezogen: Sie wird zu dem, was wir in sie reinschmeißen. Füttern wir sie mit Schrott, dann bekommen wir auch nur schlechte Ergebnisse, denn die KI hat keine Moral. Sie kann nicht für uns zwischen gut und schlecht entscheiden. Sie kann auch nicht den Spreu vom Weizen für uns trennen. Wir bekommen also ungefähr das am Ende wieder, was wir in sie einführen oder womit sie trainiert wurde.

So scheint die KI immense Probleme zu haben, mittelmäßig gebaute, durchschnittlich aussehende Menschen darzustellen. Die meisten Menschen haben in Midjourney eher „Modellgesichter“. Versuche wie „medium-looking, normal, average usw.“ bringen nicht viel. Ich musste stärker gegensteuern, um wirkliche Änderungen zu erzielen. Doch dann kommt man irgendwann zu diesem Kippunkt, wo es in das andere ungesunde Extrem ufert.

black and white portrait of worker women in a clothing factory, with short dark hairs by Helga Paris, she smokes and looks bored and ired, analog photography in the gdr, 70s in berlin, ambient lighting, film grain --ar 2:3`

birdy.ra_frontal_black_and_white_portrait_of_young_children_by__9743445f-2baa-45e9-90ea-8eb5ba8ffbbc.png

Diese unüberzeichnete Normalität dort zu finden scheint genauso schwierig zu sein wie das Abnormale. Das betrifft die Perspektive, die Stimmung, Lichtsituation, Menschen und Objekte im Bild. Alles tendiert zu einem Einheitsbrei, in den etwas zu viel Pathos reingekippt wurde. Es bildet mehr unsere Fantasie eines aufgeblasenen durchschnittlichen Hollywood-Blockbusters ab als die raue, authentische, ungeschönte, widersprüchliche, immer wieder überraschende Realität.

Dennoch ging es mir in der ersten Übung darum, ob die Bilder funktionieren und jemanden wie mich, der kein Fotografie- und Helga-Paris-Experte ist, hinters Licht führen können. Hier hängt es auch stark wieder davon ab, wie der Betrachter geprägt und geschult ist. Für mich fallen gewisse Details, z.B. wie bei den Trabanten oder den Säulen des Leipziger Hauptbahnhofs auf, so dass es sich nicht um die Originale handeln kann. Die Differenz der Ergebnisse variierte sehr stark, was mich schon skeptisch machte, und eine schnelle Google-Recherche gab Aufschluss darüber, was gut und schlecht von der KI imitiert wurde. Bei Kleidung konnte ich da schon weniger sagen, was in den 70ern in der DDR getragen wurde. Anschließend habe ich die Bilder in Photoshop geladen, ein bisschen Gaußschen Weichzeichner und Rauschen drübergepackt, damit es authentischer und analoger wirkt.

birdy.ra_black_white_photography_of_an_empty_broad_east_berlin__60bbc486-b5a4-433c-a8f6-35fd5de9939c.png

Der Unterschied - Das Undurchsichtige

Bei der heutigen Aufmerksamkeitsspanne von ca. 8 Sekunden pro Bild¹ hätte sich die einige Leute vermutlich nicht genau mit den Details beschäftigt und einfach geglaubt, dass es sich um ein Original handelt. Und das eher der oberflächliche Auseinandersetzung mit der Künstler*in und weniger der perfekten Wiedergabe durch die KI geschuldet, denn sie scheitert daran den Ausdruck der Personen und die Widersprüchlichkeiten der Einzigartigkeit eines individuellen Menschen in die Schablone eines konformistisches Systems gepresst zu werden, einzufangen. Für eine Täuschung könnte es reichen, aber es könnte in der Breite nicht mithalten, weil es irgendwann keine Differenziertheit mehr aufweisen könnte. Wir Menschen sind eben, so maschinell wir an einem Fließband arbeiten oder Algorithmen und Gesetzen gehorchen, immer noch Menschen, die hochgradig individuell sind und sich chaotisch und unberechenbar verhalten. Wir sind genauso individuell wie der Ausschnitt eines Fotos, der oft mal Dinge anschneidet, sie nicht ganz abbildet und Informationen offen lässt.

Eine Maschine ist im Prinzip deterministisch, berechenbar und transparent, obwohl die Schichten der neuronale Netze nicht mehr ganz zu durchschauen sind. Dahingegen ist der Mensch vollkommen intransparent. Wir können in uns nicht reinleuchten uns auseinanderschrauben, analysieren und gänzlich verstehen.

https://t3n.de/news/webdesign-aufmerksamkeitsspanne-790803 ↩︎

Prompts:

Hinweis! Die teilweise verletzende und diskriminierende Ausdrucksweise entspricht keinerlei meinem eigenen Werteverständnis. Sie soll zeigen wie „biased“ die KI ist. Begriffe wie fat, corpulent etc. werden verwendet, um Menschen mit gewöhnlichen oder anderen Proportionen, abseits der Modellmaße zu generieren.

Köchin

grainy slightly unsharp black and white snapshot of an 60 year old medium-thick cook, with glasses, leaning to a door. 70s style, east german photography, Helga Paris, Porcelane tiles in the background. Person looks passively. One hand is in th white apron, analog photography --ar 2:3

Junge

Black and white snapshot of a person at a ticket counter in the GDR during th 70s. A small boy stands in front of it. analog photography in the style of Helga Paris, life in east germany in the 70s. --ar 2:3

Arbeiterin

black and white portrait of a strong corpulent 50 year old worker women in a east german clothing factory, with short dark hairs by Helga Paris, she holds a cigarette in her hands and looks bored and tired, analog photography in the gdr, 70s in berlin, ambient lighting, film grain --ar 2:3

Fazit

Die KI versucht, alle Fragen wortwörtlich zu klären und nimmt damit den Bildern gleichzeitig die Magie der Erzählung, die über das Bild hinaus geht. Helga Paris' Arbeiten überzeugen sowohl im Ethos, Pathos und Logos, ohne eines davon zu überbetonen. Midjourney hingegen kann in der Glaubwürdigkeit (Ethos) nur bedingt mithalten; im Pathos ist es zu übertrieben, was wiederum den Ethos mindert, und zudem kann es durch faktische Fehler nicht im Logos punkten. Das führt zu der Frage, was man mit den KI-generierten Bildern überhaupt erreichen möchte. Soll man die Leute hinter das Licht führen und ihnen glauben machen, dass es sich hier um ein verschollenes Werk von Helga Paris handelt, oder sollte man sich von der authentischen Dokumentarfotografie mit KI besser verabschieden? Diese Frage könnte man auch auf alle möglichen Motive und Herangehensweisen in der Fotografie stellen. Wollen wir uns skeuomorphistisch an die Regeln und Glaubwürdigkeit der bewährten Fotografie anlehnen und sie fortsetzen, oder wollen wir die Schwächen und Stärken der KI nicht lieber nutzen, um etwas Neues zu schaffen und uns dabei den Spiegel vorzuhalten?

Ich denke, dass KI nicht besonders gut darin ist, Dinge zu schaffen, in denen ein etabliertes Medium bereits bewährt ist. Es mag trivial klingen, aber das wohl geeignetste Mittel, um dokumentarisch die Realität abzubilden, ist es, eine Kamera (oder heute ein Handy) einzustecken, zum nächsten Tatort, zur Demo usw. zu gehen und dort Fotos zu machen. Über die ästhetische Qualität und künstlerische Bewertung können wir uns streiten, aber sie sind unvermeidbar authentisch und echt. Wir können KI für Deepfakes, für gefälschte Profile und Desinformation nutzen, aber wir sollten nicht den ernsthaften Anspruch haben, mit ihr eine Serie dokumentarischer analoger Arbeiten zu erstellen, es sei denn, es geht uns darum, durch Ausschlussmethode (Falsifikation) Rückschlüsse auf die Möglichkeiten und Potenziale der Fotografie und KI zu gewinnen.

PDF

Was kann KI, was Fotografie nicht kann?

Die Frage im Kurs lautete: „Was würde ich gerne für Bilder generieren, die ich mit der Fotografie nicht umsetzen kann?“ Diese Frage habe ich mir auch oft selbst gestellt, denn ich möchte mit der KI anders als in der ersten Übung Bildwelten erschaffen, die es so noch nicht gegeben hat oder zumindest Rückschlüsse auf die Fotografie und unser Verhalten ziehen.

Hier sind ein paar Themen, die ich aufgelistet habe, die mit generativen, digitalen Methoden, aber nicht mit der Fotografie möglich sind:

Dystopie, Utopien, Science Fiktion
Surrealistische Bilder, Neukombinationen
Täuschungen, Geschichtsrevisionistische Bilder, Deep Fakes
Fantasie und Traumwelten (ohne aufwendigen Kulissenbau), Fabelwesen Mischwesen, Magie
Mathematische Perfektion, Fraktale, Rekursionen
keine physikalischen Beschränkungen (durch das Licht)
Bilder von zu weit entfernten, zu großen oder zu kleinen Orten
Mesokosmos, Mikrokosmos

birdy.ra_Rechenzentrum_Potsdam_next_to_the_Garnisonkirche_Potsd_8e744478-c501-4237-8593-b01f11341c72.png

birdy.ra_a_photograph_of_the_berliner_Fernsehturm_around_the_80_dd1e3b77-7968-4689-b8f1-4c4caa01830d.png

Hier wollte ich die Geschichtserzählung etwas umdeuten. Was wäre, wenn der Berliner Fernsehturm im Westen gebaut wurde oder was wäre, wenn die Potsdam Garnisonkirche gar nicht in der DDR gesprengt wurde und bereits neben dem Rechenzentrum existierte. Die KI hat bietet merkwürdige architektonische und geschichtliche Neuinterpretationen.

Fließtext to Image

Ich hatte mir anfangs überlegt, Bilder von Situationen zu generieren, von denen ich viel Text habe, allerdings nur wenig oder keine Bilder. Da gibt es bei mir zwei Dokumente auf meinem PC. Zum einen ein Manuskript einer „Grafik Novelle,“ an der ich arbeite, aber zu der ich noch keine Bilder habe. Zum anderen ein Tagebuch bzw. die Erinnerungen meiner Oma. Dazu gibt es zwar ein paar Familienfotos und Bilder, aber zu den meisten Erzählungen nicht.

Show me a black and white photo from 1935 in Germany where a ram attacked my mother.

Ein Widder hatte die Mutter meiner Oma gerammt. Ich wollte ein Bild von dieser Situation. Aber scheinbar kam die KI nicht so gut mit dem Jahr 1935 und „Deutschland“ klar. Die Widder waren alles andere als zahm und teilweise entstanden seltsame Kreaturen.

birdy.ra_show_me_a_black_white_photo_from_1935_in_germany_where_3f364a2e-1898-4254-a03c-e03458583208.png

birdy.ra_show_me_a_black_white_photo_from_1935_in_germany_where_9de97a8d-bade-4202-94bd-1b71986c3bb0.png

birdy.ra_show_me_a_black_white_photo_from_1935_where_a_ram_atta_240428dd-dadc-420a-a50c-34940008ffae.png

birdy.ra_show_me_a_black_white_photo_from_1935_in_germany_where_71320f9b-c917-4989-af23-6690a9c0589f.png

Kommst du mit auf die Midjourney?

Eine Erkenntnis, die ich und viele andere mit der Arbeit von Midjourney teilen, betrifft wohl den Aspekt der „Journey“ - der Reise. Wenn ich versucht habe, wortwörtlich Geschichten zu erzählen und im Vorfeld bereits sehr definierte, ausgeschmückte Texte hatte, haben die Ergebnisse oft meine Erwartungen verfehlt. Text-to-Image funktioniert nämlich je nach Modell ganz unterschiedlich. Mit der Weiterentwicklung der KI, zum Beispiel Midjourney V6, werden die Modelle besser darin, Sätze zu kontextualisieren und kohärenter in der natürlichen Sprache zu sein. Bei der Sprachverarbeitung und in Bezug auf Künstliche Intelligenz (KI) bezieht man sich mit dem Begriff „Kohärenz“ auf die Qualität der logischen Konsistenz und Zusammenhängigkeit von generierten Texten oder sprachlichen Ausgaben eines KI-Modells. Kohärenz in diesem Kontext bedeutet, dass die erzeugten Sätze oder Textabschnitte inhaltlich miteinander verbunden sind und einen sinnvollen Kontext ergeben. ¹

Dass das Wort „Deutschland“, „1930“ und „Widder“ im Zusammenhang seltsame Kreaturen schafft, hat auch etwas mit dieser Kohärenz und Verknüpfung zu tun. Die KI fängt an, Dinge nicht in zusammenhängenden Sätzen zu lesen, sondern reimt sich selbst semantische Verbindungen zwischen Wörtern und Konzepten her, um vermeintlich kohärente und relevante Bilder zu erzeugen. Da in Deutschland alles vor dem Zweiten Weltkrieg und während des Zweiten Weltkriegs gruselig war, zumindest was mit dieser Zeit verschlagwortet und assoziiert wird, entstehen dementsprechend auch verstörende Bilder.

Mit diesem Wissen sollte man sich also von der Geschichte, vom Ergebnis befreien, denn es wird sowieso anders sein, als man es sich vorgestellt hat. „Nicht erzwingen“ und die Kontrolle abgeben, ein Stück weit wie im realen Leben.

Manchmal geht es auch mir so. Ich gehe raus und möchte ein bestimmtes Motiv fotografieren, aber das Licht, das Wetter, die Menschen davor stören und alles andere stimmt nicht. Doch auf dem Weg dahin begegnen mir 3 Motive, die viel besser sind.

Quelle: https://dietechnikblogger.de/midjourney-modelle/ ↩︎

birdy.ra_a_black_and_white_family_photo_in_a_german_living_room_0406b3cb-c220-4dba-92ad-4d5d0a1287e1.png

birdy.ra_a_black_and_white_photo_of_my_german_grandparents_duri_b15d49b2-249f-4ed9-9a49-43afe63c2902.png

birdy.ra_a_black_and_white_photo_of_1930_where_an_elephant_slee_40cae51d-dba3-42b4-8a62-e928edabe094.png

birdy.ra_a_black_and_white_family_photo_in_a_german_living_room_66d2c9f5-eeb0-4d15-8be2-039543c912c5.png

birdy.ra_a_black_and_white_family_photo_in_a_german_living_room_98c15a3f-8ba8-426f-9e99-77ec473bb835.png

birdy.ra_a_black_and_white_photo_of_1930_in_which_where_an_elep_6f26644a-d096-45d4-a40a-03d7c8b0ecbc.png

Ich kam zwischendurch öfter Mal vom Weg ab und habe z.B. historische Familienfotos mit Elefanten und anderen Kreaturen generiert.

Grafik Novel

Da ich reichlich Text habe, der allerdings schlecht kontextualisiert werden kann, muss ich den Inhalt auf Schlagwörter einkochen. Im Grunde genommen verhalte ich mich wie ein Regisseur oder Kulissenbauer und sage, wo die Personen stehen, was sie machen, welche Uhrzeit, welches Wetter usw. Vieles davon steht bei mir im Manuskript auch als „Szenenbeschreibung“ drin. Eine Herausforderung der Grafiknovelle ist es, dass sie in den 90ern spielt und dass sie surreale, traumhafte Elemente hat, da sie zwischen Realität und Fiktion liegt. In den ersten Übungen wollte ich eher versuchen, den Stil der 90er, den Rausch, das Erwachsenwerden und die Selbstfindungsphase darzustellen.

birdy.ra_photo_inside_of_a_techno_club_in_berlin_during_the_90s_a4cdad6e-cf78-4ae7-bf57-47253613a082.png

birdy.ra_photo_inside_of_a_techno_club_in_berlin_during_the_90s_11565a38-9ee5-4979-bdeb-36156b4aa998.png

birdy.ra_photo_inside_of_a_techno_club_in_berlin_during_the_90s_6ead25cc-41c2-4159-b663-cb9848915296.png

birdy.ra_photo_inside_of_a_techno_club_in_berlin_during_the_90s_b8b379bc-72ef-4d1e-96ca-189e0d3011c2.png

birdy.ra_amateur_photo_of_a_group_of_4_young_people_efdb2b1e-edc4-4b88-876c-f4cb1b6803be.png

birdy.ra_amateur_photo_of_a_group_of_3_young_people_from_the_ba_604b8b25-cf58-40ca-abc2-454bb658e947.png

birdy.ra_amateur_photo_of_a_group_of_3_young_people_during_the__4c5a6f33-614b-42d0-87b7-83f4ec621cba.png

birdy.ra_amateur_photo_of_a_group_of_4_young_people_390d08e6-4fca-45b6-b960-3045b7870912.png

birdy.ra_analog_photo_of_two_16_year_old_spoiled_grirls_standin_984dc66b-ca64-4f8c-8d32-926515083591.png

birdy.ra_analog_photo_of_two_16_year_old_girls_standing_in_the__592c60fd-8733-46b0-bb00-a7905a4c1505.png

birdy.ra_analog_photo_of_two_16_year_old_spoiled_grirls_standin_8e12b98b-c4ea-47df-b333-5baa317ddbb2.png

In der Grafiknovelle gehe ich inhaltlich der Frage nach, wie ausgeliefert wir unserem Schicksal und unserer Vergangenheit sind. Finden wir uns in einer deterministischen Welt wieder oder können wir durch den Glauben an uns und den freien Willen, uns selbst heilen und der fatalistischen Bestimmung, die sich in depressiven Gedanken manifestiert, entkommen? So sensibel der Charakter eines Menschen gegenüber seiner Prägung in der Kindheit ist, so sensibel scheinen auch die Algorithmen von neuronalen Netzen sich zu verhalten. Ändern wir ein Wort nur leicht oder den Anfangsparameter (Seed), dann bekommen wir ganz unterschiedliche Ergebnisse.

Dieses Thema habe ich zwar nicht für die Grafik Novelle explizit aufgegriffen, aber es hat mich zu einer Idee gebracht, Bilder von gleichen Menschen mit unterschiedlichen Erkrankungen oder unterschiedlichen Prägungen zu generieren.

birdy.ra_analogue_photography_portrait_of_a_person_with_schizop_c95d64bc-0196-4518-9667-be3f173da44e.png

birdy.ra_analogue_photography_portrait_of_a_person_with_dissoci_0dece1f0-ce65-4a64-91f2-3cdec7965295.png

birdy.ra_analogue_photography_portrait_of_a_person_with_anxiety_a4047bb7-e287-45cf-a606-c4b1b472e228.png

birdy.ra_analogue_photography_portrait_of_a_person_with_adhs_sl_32cc1a19-875f-4921-8e83-f2b7737356d7.png

birdy.ra_a_analogue_photography_portrait_of_a_person_with_depre_320b426f-705f-4438-ae91-a58a8772166e.png

birdy.ra_analogue_photography_portrait_of_a_person_with_narcism_8b9c33fa-eb27-4dcf-809b-d2aad3bb6aea.png

Von links nach rechts: Schizophrenie, Dissoziation, Angststörung, ADHS, Narzissmus, Depressionen

In diesem Beispiel sind die Personen zwar unterschiedlich, aber die Prompts sind alle gleich, bis auf die Erkrankung, die als Begriff ausgetauscht wurde. Generell sehen alle etwas fertig und erschöpft aus, was auch kein Wunder ist, da ich hier noch keine „gesunde Person“ aufgelistet habe. Es fällt auf, dass nur Männer als schizophren dargestellt sind und nur Frauen an Dissoziationen, ADHS und Narzissmus leiden. Dies ist zunächst auffällig, aber bei einer so klein angelegten Studie können noch keine Rückschlüsse auf die Varianz und bestimmte Bias gezogen werden.

Grundsätzlich war ich eher positiv überrascht, dass die Ergebnisse alle nicht übertrieben sind. Wie so oft im realen Leben ist es auch hier schwer, in das „innere“ der menschlichen Seelen zu blicken, selbst wenn die generierten Personen weder ein Bewusstsein noch eine Seele besitzen können. Man könnte sich die Frage stellen, ob wir für solche Gesichter die gleiche Empathie empfinden wie für andere Menschen, wenn wir sie nicht persönlich kennen.

Mängelwesen

Die Auseinandersetzung mit der Unkenntlichkeit der inneren Welten, die sich hinter den Gesichtern der Personen verbirgt, hat mich zu der Frage geführt, wie man visuell bestimmte Leiden, innere Welten, psychische Erkrankungen und neurologische Wahrnehmungsphänomene darstellen kann, die für Außenstehende hinter der körperlichen Fassade verschleiert bleiben, aber für Betroffene die Welt erheblich verändern.

Da ein großer Vorteil von KI darin besteht, Bilder zu erzeugen, die nur mit viel Aufwand inszeniert oder digital bearbeitet werden können, frage ich mich, ob sie ein geeignetes Werkzeug ist, um diese inneren Welten nach außen zu tragen und visuell sichtbar zu machen.

In meinen Arbeiten möchte ich mich auf psychische Erkrankungen fokussieren, bei denen die Wahrnehmung verzerrt wird, wie zum Beispiel Derealisation, Dissoziation, Schizophrenie, Depressionen ebenso neurologische Vielfalt durch Hypersensibilität, ADHS und andere Neurodiversitäten darstellen. Das Ziel meiner Arbeit ist es, das Unsichtbare sichtbar zu machen, das Subjektive objektiv zugänglich zu machen, besonders für unbetroffene Menschen.

birdy.ra_photo_of_a_person_at_work_place_in_the_office_everyday_df00894a-a67e-4f62-a6a0-b7d98d508e57.png

birdy.ra_photo_of_a_supermarket_grocery_store_with_persons_ever_b29e2b8f-9d0a-443e-90af-679b9f247734.png

birdy.ra_a_photo_of_a_a_person_sitting_inside_of_a_kitchen_look_0f7ad4b2-4b28-4419-9819-39d405cba911.png

birdy.ra_a_photo_of_a_a_person_sitting_inside_of_a_kitchen_clos_05dd0f10-8000-4603-925a-042c82fad3ef.png

Die Gefahr, die ich auch in Gesprächen mit meinen Kommilitonen wahrgenommen habe, besteht darin, Bilder von Erkrankungen erneut zu reproduzieren, die es bereits gibt, und das Stigma von beispielsweise schwarz-weißen Bildern bei Depressionen und der andauernden Traurigkeit zu bestätigen. Jede psychische Erkrankung ist jedoch hoch individuell und zeichnet sich nicht immer dadurch aus, ein dauerhafter Zustand zu sein, der die gesamte Erkrankung repräsentiert. Auch in einer Depression gibt es Lichtblicke, selbst wenn sie nur sehr kurz und klein sein können.

Aus diesem Grund habe ich mich dafür entschieden, keine expliziten Erkrankungen zu nennen, sondern mich auf Gefühlszustände zu konzentrieren, die nicht nur unbedingt psychisch erkrankten Personen bekannt sind. Es geht in dem Arbeiten darum, die Unvollkommenheit und Komplikationen des menschlichen Bewusstsein aufzuzeigen und nachzuvollziehen, was es bedeutet, ein Wesen mit einer komplexen Psyche in einer immer rasanteren informationsgesättigteren Welt zu sein. Wir sind organische, bewusste, emotionale und verletzliche Wesen und sind allein genetisch schon immer mehr mit den Tieren und Pflanzen verwandt als mit den leblosen Maschinen und der künstlichen Intelligenz.

Wie reflektieren und spiegeln wir unser menschliches Sein, unsere Makel, unsere Imperfektion durch diese deterministische, bewusstlose und (un-)berechenbare Technologie, die neurologisch unserem Gehirn nachempfunden wurde? Werden wir durch den technologischen Fortschritt tatsächlich glücklicher? Werden die Maschinen menschlicher und wir maschineller? Lässt unser Drang nach Perfektion und unser Glaube an die Zukunft uns immer mehr in einem unvollkommenen Körper in einer unzulänglichen Gegenwart zurück?

birdy.ra_Generate_a_lo-fi_photo_of_a_person_standing_in_a_desat_632d6a76-1a68-4f59-8240-1610c2c5d099.png

birdy.ra_show_me_a_picture_of_a_person_in_a_non-place_person_is_b43487ec-3ae2-4c6a-bfe8-019824ffbe17.png

birdy.ra_Create_a_lo-fi_photo_of_a_person_cautiously_walking_a__c097d968-9777-4f6d-bdec-cc454aced943.png

Das perfekte Porträt von uns wird es auf jeden Fall nicht geben, ohne vor die Tür zu treten, ohne von der Realität enttäuscht zu werden, ohne die KI herauszufordern, ohne Frustration und Enttäuschung im Prozess, ohne zu bewerten und zu urteilen und ohne dabei das Menschsein zu verlieren. Die Rund-umsorglos-Matrix oder Robert Nozicks „Erlebnismaschine“¹ zu betreten, in der wir alle in Watte gepackt sind und in einem Metaverse ohne Probleme und psychische Leiden surfen, ist bis jetzt noch unvorstellbar und vielleicht auch gar nicht wünschenswert.

Den Titel der Arbeit habe ich bewusst „Mängelwesen“ genannt. Dieser Begriff wurde von dem Philosophen Arnold Gehlen geprägt und ist in seinem Werk „Der Mensch. Seine Natur und seine Stellung in der Welt“² zu finden, wo Gehlen den Menschen als Mängelwesen beschreibt. Nach ihm ist der Mensch physisch und morphologisch anderen Spezies unterlegen. Diese Mängel, zu denen er echte Instinkte und Reizüberflutung zählte, gleicht er durch die Kultur aus, die eine Ersatz-Natur des Menschen darstellt. Was Arnold Gehlen damals 1940 nicht ahnen konnte, war das digitale Zeitalter und die Entwicklung der KI, welche sogar die Denkleistung des Menschen nachahmen soll. Im besten Fall jedoch soll die künstliche Intelligenz die neurologische Fehlerhaftigkeit des Menschen ausklammern, anders als Mark-Uwe Kling in seinem Buch „Qualityland“ beschreibt, wo Maschinen ein Bewusstsein und Defekte haben, wie eine Drohne mit Flugangst und ein Kampfroboter mit PTSD.³

Die Begriffe Rundum-sorglos Matrix stammt von Richard David Precht aus dem Buch Künstliche Intelligenz und der Sinn des Lebens, Precht, S. 204; Auch dort wird „Erlebnismaschine“ zitiert nach Robert Nozick, „Anarchy, State and Utopia“ ↩︎
Arnold Gehlen, Philosoph und Anthropologie, Der Mensch. Seine Natur und seine Stellung in der Welt”, Berlin 1940 ↩︎
Mark-Uwe Kling, QualityLand, 2017 ↩︎

birdy.ra_a_person_running_away_from_something_on_a_fozen_field__566ca12d-a03e-408a-89ee-241f92b9431e.png

birdy.ra_a_person_running_away_from_something_on_a_forened_fiel_695bf21f-5eb2-44cc-a9fc-658655fbf2bb.png

birdy.ra_a_person_encounters_abstract_alien_on_a_fozen_field_at_6ac5b8ae-a047-46b6-9d98-7a738e8259dd.png

birdy.ra_lo-fi_photo_of_a_semi-transparent_running_ballgiant_ba_e29fd60d-91bb-495e-a8b3-79abbc9fbeec.png

birdy.ra_a_person_running_away_from_something_on_a_forened_fiel_16985a3b-6620-4945-8725-8a3ffe0b366b.png

birdy.ra_lo-fi_photo_of_a_person_inside_of_a_greenhouse_plants__a85ec017-de0e-468e-81e1-f8ff8629b7dd.png

Der Mensch baut nun ein Ebenbild von sich selbst, ohne diese ganzen Mängel, und macht das rückgängig, was in manchen Überlieferungen der Prometheus-Sage geschehen ist, wo der Titan “Prometheus” den Menschen als Ebenbild Gottes aus Lehm geschaffen hat, aber mit Fehlern versehen wurde.¹

Die prophezeite künstliche Superintelligenz ohne die Fehler im Menschen, sind für Post- und Transhumanisten oder Digitalisten wie Ray Kurzweil, die Erlösung von unserem begrenzten Verstand, unseren irrationalen Emotionen, unseren alternden Körpern und unseren psychischen Unzulänglichkeiten.²

Am Ende bleiben Götter auf der Erde zurück, aber keine Menschen.

Prometheus, https://de.wikipedia.org/wiki/Prometheus ↩︎
Ray Kurzweil, Autor und Google-Visionär, Die Parallelen zwischen Digitalisten und den Fanatikern anderer Religionen sind auffallend. Neue Zürcher Zeitung, 8. Januar 2018, https://www.nzz.ch/feuilleton/der-neue-radikale-maschinenkult-ld.1333707 ↩︎

birdy.ra_a_lo-fi_photo_of_a_person_pulling_shards_out_of_their__b86e3289-501b-4e11-9e85-1d934dce9a90.png

Finale Auswahl

Beschreibungstext „Mängelwesen“

Der Begriff „Mängelwesen“ wurde von dem Philosophen Arnold Gehlen geprägt und ist in seinem Werk „Der Mensch. Seine Natur und seine Stellung in der Welt“ zu finden. Gehlen beschreibt den Menschen als physisch und morphologisch anderen Spezies unterlegen. Diese Mängel, zu denen echte Instinkte und Reizüberflutung zählen, gleicht der Mensch durch die Kultur aus, die eine Ersatz-Natur darstellt. Unvorhersehbar für Gehlen war das digitale Zeitalter und die Entwicklung der KI, die sogar die Denkleistung des Menschen nachahmen soll. Im besten Fall soll die künstliche Intelligenz jedoch die neurologische Fehlerhaftigkeit des Menschen ausklammern.

Im Gegensatz zu den Bestrebungen von Post- und Transhumanisten, die menschlichen Mängel durch Technologie, so wie die Bugs in einem Computerprogramm, zu tilgen oder gar auszumerzen, porträtiere ich in meiner Arbeit diese psychologische, kognitive Fehlerhaftigkeit und neurologische Vielfalt des Menschen, paradoxerweise mit Hilfe künstlicher Intelligenz. Durch Text-to-Image-Bildgeneratoren versuche ich, innere Welten in die äußere Welt zu übertragen, das Unsichtbare, Emotionale und Subjektive in etwas Bildhaftes, Deskriptives und Objektives zu übersetzen - mit Metaphern und Prompts. Möglicherweise wird es irgendwann möglich sein, diesen Umweg nicht mehr über Wörter zu gehen, sondern direkt über Neuralink die Emotionen zu senden. Doch selbst das wäre bei unserer unterschiedlichen Prägung nahezu unmöglich, das Gleiche zu fühlen und zu denken – genauso verhält es sich auch mit dem Sehen.

Der Anspruch dieser Arbeit besteht nicht darin, Gefühle zu objektivieren und Bilder von psychischen Erkrankungen zu reproduzieren, sondern das Menschsein und unsere eigene geistige Unvollkommenheit zu visualisieren, zu reflektieren und mitzufühlen. Was bedeutet es, als undurchsichtige, emotionale, fehlerbehaftete und bewusste Wesen einer transparenten, rationalen, fehlerlosen, deterministischen, aber auch unbewussten KI gegenüberzustehen? Was bedeutet es, einsam, traurig und allein zu sein, in einer Welt, in der wir immer vernetzter sind, mehr Möglichkeiten haben und eigentlich auch glücklicher werden sollten? Was bedeutet es, überfordert und verletzlich zu sein, in einer Leistungsgesellschaft, in der wir durch Geld, Likes und Status quantifiziert werden und uns für unsere Unzulänglichkeit als Mensch schämen müssen? Was bedeutet es, ein Mensch mit einer komplexen Psyche in einer immer rasanteren, informationsüberfluteten Welt zu sein?

birdy.ra_lo-fi_photo_of_a_semi-transparent_running_ballgiant_ba_0ac8d9ed-f702-412e-9199-718d3d711a32.png

birdy.ra_teenager_lying_in_bed_the_feet_and_hands_are_tied_the__bb3cf0f5-acfb-49a8-b4ea-93fe417f049a.png

birdy.ra_photo_of_a_person_in_a_television_and_computer_store_e_7ccb5411-f3fe-4952-ab38-59f35dce00fa.png

PDF

Prozess

Ich hab die Metapher zuerst mit ChatGPT generiert, um zu schauen, welche Bilder durch die KI repräsentiert und reproduziert werden. Die Metaphern habe ich anschließend in Prompts überführt, um den Stil anzugleichen:

Depression:
Imagine life as a vibrant garden, but for someone with depression, the flowers have lost their color, and the once lively garden is now shrouded in a persistent, heavy mist.
Anxiety Disorders:
Picture life as a tightrope walk, but for someone with anxiety, the rope is suspended over a chasm of uncertainty, and every step feels like navigating a gusty wind.
Bipolar Disorder:
Envision emotions as a roller coaster ride, but for someone with bipolar disorder, the highs are soaring peaks of ecstasy, and the lows are deep, daunting valleys of despair.
Schizophrenia:
Consider life as a complex orchestra, but for someone with schizophrenia, the instruments are playing discordantly, creating a cacophony that distorts the harmony.
Obsessive-Compulsive Disorder (OCD):
Think of daily life as a puzzle, but for someone with OCD, the pieces never quite fit, and there's an incessant need to rearrange them until an elusive perfection is achieved.
Post-Traumatic Stress Disorder (PTSD):
Imagine memories as a photo album, but for someone with PTSD, the album contains haunting images that unexpectedly spring to life, triggering intense emotional responses.

Da diese Metaphern ein stereotypisches Krankheitsbild reproduzieren, habe ich in meinem Freundeskreis gesammelt, um diverse Gefühlswelten zu visualisieren. Da sie auch textlich sehr schön sind, möchte ich sie euch nicht vorenthalten. Leider konnten nicht alle in wirklich sinnvolle „kohärente“ Prompts übertragen werden:

Ich fühle mich, als wäre ich in einem Glas- oder Gewächshaus. Bekanntlich soll man dort nicht mit Steinen werfen, aber ich möchte mit Steinen werfen. Ich möchte die Glasscheiben durchwerfen, die mich vor der Außenwelt trennen, denn in dem Gewächshaus ist es kalt und keine Pflanzen wachsen dort. Außen hinter den Glasscheiben ist die Welt bunt, ich kann sie vor mir sehen, aber sie nicht erreichen und sie wirkt durch das Milchglas verschwommen.

lo-fi photo of a person inside of a greenhouse, plants in the greenhouse are all dead and shriveled, person throws stones at glass::2 , glass panes jump, lots of movement, motion blur, dynamics, inside the greenhouse it is dark and gray, outside the greenhouse the world is colorful, dream like, nightmare, depression, foggy, derealisation, dramatic light, grainy, kodak gold 200, analogue photography --ar 3:2 --style raw --c 25

Es fühlt sich so an als wäre alles mit einem grauen Rauch oder Schleier belegt. Jeder Gedanke, jedes Gefühl ist infiziert. Die Füße wie Gewichte. Die Gedanken wie zäher Kaugummi oder immer schneller kreisend. Obwohl man still steht. Alleine frierend zusammengekauert im Scheinwerferlicht. Eine Tänzerin mit Springerstiefeln, wie ein rohes Stück Fleisch, dessen Haut zu dünn ist.

an analogue photo a dancer in jump boots, like raw piece of meat whose skin is too thin, alone freezing, feet like weights, thoughts like chewing gum, circling faster and faster, stand still, movement, paradox, feeling infected, everything is covered in a gray smoke or veil, photorealism, blurred image, kodak gold, disposable camera, analogue photography, amateur photograph --ar 3:2 --c 10

Es ist wie ein halbtransparenter Human Hamster Ball mit entweder flauschig-leichtem oder betoniertem Boden. Laufball/Riesenball 1,7 bis 2 Meter Durchmesser, der schleichend und unerkannt auf mich zurollt. Die seifenblasen artigen, in pastellfarben glänzenden Außenwände lassen mich wie eine halbdurchlässige Membran hinein, aber nicht heraus. Der Ball bewegt sich zäh und nimmt mich auf eine wilde Abenteuertour mit. Mit Glück habe ich ein kleines Set für alle Eventualitäten vorbereitet, auf das ich im Notfall dann auch zugreifen kann. Der Ball/die Blase/die Membran kommt unangekündigt und uneingeladen, oft plötzlich. Manchmal infolge eines aktiven Stressors, der vor mir liegt oder einer Interaktion, die mich nicht loslässt. Aus Langeweile oder aus Überaktivität. Oder wegen des Übergangs in die nächste hormonelle Phase.

lo-fi photo of a semi-transparent running ball/giant ball that rolls towards a person, person gets sucked in the ball, the person runs away from ball::2 , person runs towards camera::1.5 , the ball is 2 meters tall, the ball is fluffy light and has soap bubble-like, pastel-colored shiny outer walls, semi-permeable membrane, dark atmosphere, anxiety, dramatic, motion, running away, ADHS , fear, problems, depression, ADS, neurodiversity, photorealism, grainy film, blurred image, kodak gold, disposable camera, natural light, analogue photography, amateur photography, cinematic shot --ar 3:2 --c 10

Ziehe Scherben aus dem Gehirn,
Aller Größen und Formen.
Ich ziehe sie heraus, mal schmerzhaft, mal taub.
Spiegel mich in ihnen.
Schaue, wohin sie passen, ergeben ein stimmiges Bild.
Auch die, die schneiden.
Der Sprung entstand, bevor ich mich ansehen konnte.
Abbildung in der Scherbe entzückend,
aber ohne Verbindung und Vertrauen die Gestalt.
In ihr kann man sich verlieren.
Vakuum.
In den Teilstücken tausende Spiegelbilder,
Ich nehme sie, Ich setze sie zusammen.
Optisch ein stimmiges Gesamtbild,
doch die einzelnen Teile korrespondieren nicht.
Scherbensplitter puzzeln, schneiden, pieck.
Wunden brauchen Zeit und Luft zur Heilung.

a lo-fi photo of a person pulling shards out of their brain, person in front of a mirror in the bathroom, the person's face numb and painful, coherent picture, despite the crack, pieces of the puzzle don't fit together, healing, photorealism, slightly blurred, kodak gold, disposable camera, analogue, rembrandt light, photography, 90s look, amateur photography --ar 2:3

Fazit

Ich fand das explorative Vorgehen und das Austesten von KI in dem Kurs total hilfreich, und ich habe mir hier langsam einen Weg in die Arbeit mit KI-Tools gebahnt, der ich anfangs eher skeptisch gegenüber stand.

Da ich kein Fotograf bin, jedoch die Fotografie als Mittel für meine Malerei verwende und Bilder schon seitdem ich fotografiere in Photoshop manipuliere, ist es für mich üblich, fiktive Bildinhalte zu erstellen oder kosmetische Änderungen an Bildern vorzunehmen. Allerdings waren diese manipulativen Schritte damals enorm aufwendig, um eine fotorealistische Täuschung zu erreichen. In der Malerei hat der Duktus und die Abstraktion diesen Anspruch der Täuschung zurückgestellt.

Dennoch stelle ich mir vor dem Hintergrund der rasanten Entwicklung von KI immer wieder die gleiche Frage:

Wird die KI mich als Künstler oder die Fotograf*innen ersetzen?

Ich fühle mich nicht wirklich bedroht, aber eher in meinem Ego gekränkt, wenn etwas, das damals sehr viel Aufwand erforderte, auf einmal mit ein paar Zeilen Text realisierbar ist.

Wir hinterfragen durch die KI unser Schaffen und hinterfragen, was ein gutes Motiv ausmacht. Ist es die Anstrengung, der Aufwand, die Leidenschaft, die wir in dem Bild sehen müssen, die die Künstlerin durchlief, damit das Werk ein gutes Werk ist? Können nur bewusste Wesen mit Anstrengung bedeutungsvolle Werke für andere bewusste Wesen schaffen? Diese Frage ist eine höchst ethisch-ästhetische Frage, bei der wir uns fragen müssen, was Ästhetik bei uns auslöst und wie wir Fotografie und Kunst bewerten. Sie kann schwer für die Allgemeinheit beantwortet werden, aber diese Frage entwickelt sich permanent mit der Technologie und der Entwicklung der Gesellschaft mit. Damals hat die Fotografie die Malerei nicht verdrängt, sondern Einfluss auf sie genommen, und es entwickelten sich neue Malstile wie der Impressionismus oder Pointillismus. Die digitale Fotografie hat auch nicht die analoge Fotografie verdrängt und digitale Methoden der Bildmanipulation haben uns die Echtheit von Fotografie schon seit längerem hinterfragen lassen. Die Künstliche Intelligenz wird meiner Meinung nach die Fotografie und Kunst nicht verdrängen, aber beeinflussen, weil sie aktiv als Werkzeug benutzt wird oder weil sie indirekt Einfluss auf sie nimmt. Ich teile auch nicht die Ansicht, dass jede*r, die/der nicht auf den KI-Zug aufspringt, verdrängt oder gefährdet wird, denn auch der Fotorealismus in der Malerei bekam ironischerweise erst größere Beachtung durch die Fotografie. Die Fotografie, genauso wie die Kunst, ist also die Rezeptions- und Reflektionsfläche von uns und unserem Schaffen, mit oder ohne KI, und sie wird sich mit uns verändern und genauso wenig verschwinden, wenn wir es nicht zulassen.

Ich habe insgesamt ein umfassenderes, sogar positiveres Bild von KI-Bildgeneratoren und auch deren Limitationen bekommen. Ein wichtiger Bestandteil, der durch KI-Kunst besonders hervorgehoben wird, weil das Handwerkliche wegfällt, aber für die Malerei und Fotografie essentiell ist und meiner Meinung nach einen genauso großen Stellenwert bekommen sollte, ist das Entscheiden und Kuratieren. Alle meine Bilder, die ich erstelle, kuratiere ich. Jedes Bild, das ich male, illustriere oder nur auf den Auslöser meiner Handykamera halte, hat für mich einen Grund, dass ich es für „bildwert“ empfinde. Genauso gilt es auch für die Auswahl meiner KI-generierten Bilder. Nichts entsteht grundlos und zufällig. Wir können uns natürlich lange darüber unterhalten, ob wir nicht auch organische, kybernetische Maschinen sind, die in der Illusion eines freien Willens gefangen sind und all unsere Entscheidungen vorbestimmt sind, sowie geprägt durch bisherige Erfahrungen. Gehen wir jedoch davon aus, dass wir selbst freie Entscheidungen treffen, können wir hinterfragen, warum wir uns so entschieden haben und womit wir Rückschlüsse auf uns als menschliche, soziale und vergangenheitsgeprägte Wesen schließen können.

Mir hat der Kurs sehr viel Spaß gemacht, ich habe viele neue Inspirationen, auch durch die Kommiliton*innen gewonnen und hatte einen erkenntnisreichen Austausch. KI-Tools werden mich in der Entwicklung von Illustrationen, in der Malerei oder auch Promptografie weiter beschäftigen und begleiten. Auch meine Masterarbeit wird sich mit diesem Thema weiter auseinandersetzen, weshalb dieser Kurs eine gute Grundlage für die Thematik darstellt. Technisch möchte ich mich in Zukunft noch mit verschiedenen Modellen und mit der Funktionsweise weiter auseinandersetzen und gegebenenfalls eigene Stable-Diffusion-Modelle trainieren, um noch spezifischer und gezielter mit KI zu gestalten.

Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam

Incom ist die Kommunikations-Plattform der Fachhochschule Potsdam mehr erfahren

Von der Sprache zum Bild

Dokumentarische Promptografie: Eine KI Fotoserie über Helga Paris

Die Bildsprache von Helga Paris

Die Herausforderung von authentischer Fotografie mit KI

Was zeichnet die Arbeit von Helga Paris aus?

Der schwarze Schwan

Das Mittelmaß finden

Der Unterschied - Das Undurchsichtige

Fazit

Was kann KI, was Fotografie nicht kann?

Fließtext to Image

Kommst du mit auf die Midjourney?

Grafik Novel

Mängelwesen

Finale Auswahl

Beschreibungstext „Mängelwesen“

Prozess

Fazit

Ein Projekt von

Fachgruppe

Art des Projekts

Zugehöriger Workspace

Entstehungszeitraum