Photonen und Pixel

Der KI-Podcast des Deutschen Fotorates

Im KI-Podcast unterhalten sich Dr. Jürgen Scriba und Boris Eldagsen mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. Medienkünstler Jürgen Scriba ist promovierter Physiker, war Wissenschaftsredakteur bei „Focus“ und „DER SPIEGEL“, Geschäftsführer DFA und leitet die Arbeitsgruppe technischer Fortschritt des Deutschen Fotorats. Boris Eldagsen ist international anerkannter Experte für KI-generierte Bilder. Seine Absage des Sony World Photo Awards löste 2023 eine weltweite Debatte aus. Er unterrichtet "KI für Kreative" an der LABASAD Barcelona.

  1. May 18

    #16 Von Algorithmischer Fotografie zu Deepfake-Erkennung | Zu Gast: Christoph Behl

    KI-Bild- und Videomodelle entwickeln sich gerade in einem Tempo, bei dem selbst Profis kaum hinterherkommen: Midjourney korrigiert seinen Kurs, ChatGPT Image 2 holt überraschend auf, und aus China kommen neue Videomodelle wie Wan 2.7 und Happy Horse. Gleichzeitig wird sichtbar, dass diese kreative Explosion teuer ist — in Geld, Rechenleistung, Energie und neuen Nutzungslimits. Die Folge diskutiert außerdem, warum KI-Bilder Fotografie, Journalismus und Wettbewerbe unter Druck setzen. Boris erklärt, warum Joan Fontcubertas „algorithmische Fotografie“ ein Nonsense-Begriff ist. Im Gespräch mit unserem Gast Christoph Behl von "It’s Real" geht es schließlich darum, wie wir in einer Welt perfekter synthetischer Bilder wieder Vertrauen schaffen können: durch Detektion, Provenienzdaten und neue „Trust Zones“ für echte Bilder. ----- Im KI-Podcast unterhalten sich Dr. ⁠Jürgen Scriba⁠, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und ⁠Boris Eldagsen⁠ (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. HIGHLIGHTS: (00:08) - EU-Guidelines zur juristischen Definition von Deepfakes i Fehlen weiterhin. Bis dahin wird praktisch weiter getestet, wie Deepfakes und synthetische Medien entstehen. (00:31) - Bei KI-Bildmodellen gab es große Bewegung Midjourney 8.1 korrigiert viele Schwächen von Version 8.0. Die neue Architektur bringt das alte „Midjourney-Feeling“ zurück. (02:17) - ChatGPT Image 2 wird neu bewertet In der Beta war es enttäuschend, inzwischen liegt es in vielen Use Cases fast gleichauf mit Nano Banana 2. (04:53) - In praktischen Bildtests zeigt sich: ChatGPT Image 2 überzeugt bei Bildrestauration, Lichtübertragung, Pose-Transfer und komplexen Bildkombinationen. Nano Banana 2 ist stärker bei Realismus, Farbpaletten und manchen Stilübertragungen. (12:41) - Im Videobereich bringt Alibaba zwei Modelle Wan 2.7 und Happy Horse. Beide kommen aus unterschiedlichen Alibaba-Labs; Happy Horse zielt stärker auf Talking Heads, Short Drama und menschliche Figuren. (15:51) - Die Kostenfrage KI-Infrastruktur, Tokenverbrauch und Rechenleistung explodieren. Nutzer merken das an Limits, langsameren Diensten und teuren Pro-Tarifen. Der Energie- und Ressourcenverbrauch wird zu einem zentralen Problem. (21:07) - KI-Bilder in Fotowettbewerben Beispiele aus Hasselblad- und Naturfoto-Wettbewerben zeigen, wie schwer Jury und Publikum echte Fotos von synthetischen Bildern unterscheiden können. (24:03) - Re-Light Nachträgliche Lichtveränderung in Fotos werden Standard. (30:00) - Philosophische Debatte Sind KI-generierte Bilder Fotografie? Boris widerspricht Joan Fontcubertas These von „algorithmischer Fotografie“ und argumentiert, KI-Bilder seien Teil eines größeren Metamediums: Latent Space. (40:47) - Zu Gast: Christoph Behl Behl erklärt, wie sein Unternehmen KI-generierte und manipulierte Bilder durch einen multisignalen Ansatz erkennt. Die Detektion basiert auf semantischen Mustern: Bildsprache, Symmetrie, Texturen, Rauschen, Frequenzen, Entropie und typische KI-Artefakte werden kombiniert. (55:09) - Beispiele An Beispielen zeigt "It’s Real", wie komplett generierte Bilder, authentische Bilder und teilweise manipulierte Bilder unterschieden werden. (58:01) - Zielgruppen sind breiter als geplant Medien, Bildagenturen, Behörden, Polizei, Militär, Versicherungen und E-Commerce interessieren sich für Bildprüfung. Besonders relevant sind Betrug, Desinformation, Bildarchive und journalistische Verifikation. (1:03:04) - „Deepfake“ Der Begriff wird kritisch gesehen, weil er juristisch und praktisch unscharf ist. Statt alles KI-generierte zu labeln, schlägt Christoph vor, stärker das Echte zu zertifizieren: Trust Zones, Provenienzdaten und geprüfte Authentizität. (1:09:41) - Fazit Vertrauen in Bilder wird künftig aktiv hergestellt werden müssen — technisch, juristisch und kulturell.

    1h 13m
  2. Apr 25

    #15 Von Verlierern zu Gewinnern | Zu Gast: Anke Schierholz & Christoph Künne

    Im aktuellen Rückblick sprechen wir über die Gründe von OpenAI, Sora 2 einzustellen. Google dominiert Bildmodelle, ByteDance/Seedance 2.0 setzt neue Maßstäbe bei Video. KI-Restaurierung, Kriegspropaganda und KI-Influencer destabilisieren Erinnerung, Wahrheit und politische Kommunikation. Wie lassen sich KI-Training, Nutzung und Vergütung fair regulieren? Fotograf:innen geraten ökonomisch unter Druck, besonders bei Brot-und-Butterjobs und hybrider Postproduktion. Wir fragen unsere Gäste: Dr. Anke Schierholz, Leiterin der Rechtsabteilung der VG Bildkunst und Christoph Künne, Kulturwissenschaftler und Mitbegründer des DOCMA Magazins. ----- Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. HIGHLIGHTS (00:08) - Sora 2 wird eingestellt OpenAI beendet Sora 2 offiziell wegen Rechenkapazitäten und neuer Prioritäten wie Weltsimulation und Robotik. (02:57) - OpenAI verliert den Vorsprung Sora 2 sollte offenbar vom Profi-Tool zum Mainstream-Produkt werden. Diese Strategie scheint gescheitert, während OpenAI bei Bild, Video und Coding nicht mehr eindeutig vorne liegt. (04:21) - Bildmodelle: Google vorn, Midjourney schwächelt Google/Nano Banana bleibt vorn. Midjourney 8 wirkt trotz neuer Architektur wie ein Dinosaurier. (09:23) - Google gegen ByteDance im Video-Wettbewerb Google setzt auf billigere Light-/Fast-Versionen, Seedance 2.0 von ByteDance auf Qualität. Nach Hollywood-Druck reagiert ByteDance mit Kennzeichnung, Watermarking und Filtern für geschützte Figuren oder echte Gesichter. (15:10) - KI-Restaurierung und Erinnerung KI-Restaurierung alter Fotos kann emotional stärkere Bilder erzeugen, verändert aber oft Gesichter und Charaktere. (18:13) - Authentizität oder Wirkung? Boris fragt, ob dokumentarische Authentizität nötig ist, wenn ein verfälschtes Bild emotional stärker wirkt. (20:33) - KI-Propaganda und synthetische Influencer KI-generierte Bilder destabilisieren Kriegskommunikation, Quellenvertrauen und historische Rekonstruktion. Figuren wie „Jessica Foster“ zeigen, wie KI-Influencer politische, militärische und erotische Fantasien bedienen. Zu Gast: Dr Anke Schierholz und Christoph Künne (23:34) - Fotografie, Einkommen und KI-Schock Der zweite Teil fragt, was mit fotografischen Einnahmen passiert, wenn Bilder für Centbeträge generiert werden. (25:49) - Von Photoshop zu KI-Workflows Bildbearbeitung verschiebt sich von klassischer Retusche zu generativen Workflows. Kund:innen erwarten zunehmend hybride Arbeit aus Foto und KI. (28:07) - Fotobranche unter Druck Besonders gefährdet sind Brot-und-Butterjobs, die oft anspruchsvollere Arbeit mitfinanzieren. (32:30) - KI-Nutzung als Stigma Viele Fotograf:innen nutzen KI längst für Retusche oder Postproduktion, sprechen aber ungern darüber. (36:08) - Der gordische Knoten der Vergütung KI-Systeme nutzen geistiges Eigentum vergangener Jahre und bedrohen nun diejenigen, die davon leben wollten. Ein globales Vergütungssystem wirkt unrealistisch. (37:48) - Umsatzbeteiligung und Nachweisproblem Anke hält Umsatzbeteiligung für denkbar, dafür müsste Training aber klar lizenzpflichtig werden. Das Hauptproblem bleibt: Urheber:innen können meist kaum beweisen, dass ihre Werke genutzt wurden. (45:01) - KI-Bilder und Schutzfähigkeit Boris fragt, ob komplex erzeugte KI-Bilder wie „The Electrician“ meldbar sein können. (49:18) - KI als Kulturbruch KI wird mit früheren Medienumbrüchen wie Fotografie und Digitalisierung verglichen. Neu ist die Breite: KI verändert nicht nur Bilder, sondern Arbeit, Denken und Zusammenleben. (53:50) - Das Mehl darf nicht gratis sein Das TDM-Fundament muss neu gefasst werden, damit kreative Arbeit nicht weiter kostenloser Rohstoff bleibt. Auch der Bäcker bekommt sein Mehl nicht umsonst. #deutscherfotorat #kibilder #fotografie

    55 min
  3. Mar 9

    #14 Von Nano Banana 2 zu Pilzen & UFOs | Zu Gast: Jens Schröter

    Im aktuellen Rückblick sprechen wir über die neuen Modelle Nano Banana 2, Seedream 5 Light und das neue Videomodell Seedance 2.0. Außerdem geht es um die massive Disruption der Produktfotografie, den Umgang mit Trainingsdaten und die Frage, warum wissenschaftliche Daten plötzlich bezahlt werden, kreative Werke aber oft nicht.Im Gespräch mit Medienwissenschaftler Prof. Dr. Jens Schröter von der Rheinischen Friedrich-Wilhelms-Universität Bonn wird es dann grundsätzlich: Was ist Kreativität, was bleibt von der Fotografie, und wie verändert KI unseren Begriff von Authentizität, Kunst und Wirklichkeit? Und was haben UFOs, Pilze und KI gemeinsam? HIGHLIGHTS (0:08) – Februar-Rückblick & Modellschub Rückblick auf den Februar 2026: Mehrere Releases und Leaks sorgen für Dynamik im KI-Toolmarkt.(0:27) – Nano Banana 2 & Seedream 5 Light Einordnung der neuen Bildmodelle und des Naming-Chaos: Nano Banana – Nano Banana – Nano Banana 2. Testergebnis: schneller, günstiger und stabiler als Seedream 5 Light, das teils inkonsistent reagiert und stärker zensiert ist.(3:29) – Vision Grounded Search Nano Banana 2 und Seedream 5 Light nutzen eine neue Logik: Das Modell kann während der Generierung online nach visuellen Referenzen suchen.(9:47) – Seedance 2.0 & verschobener Release Das neue ByteDance-Videomodell kursiert bereits online, ist offiziell noch nicht veröffentlicht. Der Release wurde offenbar mehrfach verschoben, während das Netz bereits mit Demo-Clips gefüllt ist.(10:47) – Hollywood reagiert auf KI-Deepfakes Studios und Rechteinhaber protestieren gegen die Nutzung ihrer Figuren und Gesichter ohne Zustimmung. Gleichzeitig stellt sich die Frage, ob westliche Firmen juristisch gegen ByteDance vorgehen können.(14:08) – Warum Seedance 2.0 überzeugt Aus einfachen Prompts entstehen cineastische 15-Sekunden-Clips mit Schnitt, Kameraführung, Dramaturgie und Sounddesign. Das Modell versteht filmische Sprache überraschend gut und wirkt derzeit stärker als Googles oder Klings Videomodelle. Problematisch bleibt eine chaotische, sich ständig ändernde Zensur in Beta.(19:23) – KI in der Produktfotografie Ein neues Google-Tool zeigt, wie aus einfachem Ausgangsmaterial sofort professionelle Produktbilder und Szenen entstehen. Der Markt für klassische Produktfotografie könnte sich dadurch stark verändern.(22:50) – ZDF-Fall: KI-Material im Nachrichtenkontext Diskutiert wird ein KI-generierter Clip in einem ZDF-Beitrag mit sichtbar gebliebenem Sora-Logo. Die Kritik richtet sich nicht nur auf fehlende Kennzeichnung, sondern auch auf redaktionelle Abläufe, Verifikation und Krisenkommunikation.(32:14) – Zu Gast ist Jens Schröter: Medienkultur, Pilze, UFOs Mit dem Medienwissenschaftler Prof. Dr. Jens Schröter verschiebt sich das Gespräch zu Grundsatzfragen. Beispiele aus Mushroom Studies und UFO-Forschung dienen als Metapher dafür, wie Kultur mit radikal Fremdem umgeht – auch mit KI.(37:49) – KI als fremde Intelligenz Schröter schlägt vor, KI nicht nur als Spiegel menschlicher Kultur zu sehen, sondern als mögliche Form andersartiger Intelligenz. Boris hält dagegen: Das Fremde wird meist durch menschliche Kategorien gedacht.(42:00) – Kreativität: Simulation oder Praxis Diskutiert wird, ob KI Kreativität nur simuliert oder bereits kreativ handelt. Schröter argumentiert, dass auch menschliche Kreativität meist auf vorhandenen Mustern und kulturellen Feldern basiert.(49:39) – Margaret Boden & Regelbruch Boris bringt Margaret Bodens Kreativitätstheorie ins Spiel: Kombination, Mustererkennung und möglicher Regelbruch. Offen bleibt, ob KI echte Regelüberschreitung leisten kann.(1:00:33) – Fotografie im Wandel Fotografie war historisch immer ein Feld technischer Umbrüche – von Chemie über Elektronik bis zur Digitalisierung.(1:05:29) – Authentizität, Herkunft, Kontext Entscheidend ist weniger die Frage „Ist das noch Fotografie?“, sondern unter welchen Verfahren Bilder als authentisch gelten. Transparenz und institutionelle Regeln werden zentral.

    1h 13m
  4. Feb 19

    #13 Von Multishot zu Multi-Doom

    Im Januar 2026 ist viel passiert rund um KI, Bilder und Video. Das chinesische Videomodell Kling 3.0 kann jetzt 4K-Videos, mehrere Kameraperspektiven in einem Clip und immer realistischere Szenen erzeugen, "Flux 2 Klein" ist die Minivariante von Flux 2. Wir fragen uns, was "Lügnerdividende" ist und schauen etwas genauer auf die Negativszenarien des CEOs von Anthropic. Wir untersuchen die Kennzeichnungspflicht des EU AI Acts, besprechen die Microsoft-Studie zur weltweiten Nutzung von KI und sind erstaunt, dass die USA nur im Mittelfeld und hinter Deutschland liegen. Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. HIGHLIGHTS: (0:00) – Jahresauftakt & Plattform-Update Rückblick auf Januar 2026 (Folge 13). Podcast jetzt auch auf Spotify, bald iTunes. Weniger neue KI-Modelle als erwartet. (0:52) – Neue Bild- & Videomodelle Flux 2 klein: schnelles, lokal laufendes Bildmodell.Bytedance kündigt neue Modelle an.„Kling 3.0“ (China): 4K, 15 Sekunden, Multishot (mehrere Kameraeinstellungen im Prompt), Ton- & Stimmenklonen.Trend: Video wird als generierter 3D-Raum gedacht – Bild und Film verschmelzen. (4:22) – KI im Foto-Alltag Workshops zeigen: KI wird für hybride Aufgaben genutzt (Menschen ergänzen, Retusche, Begrünung, etc.).Kommerzielle Fotografie war immer inszeniert – KI verstärkt das.Zentrale Frage: Wird das künftig als „Deepfake“ gelten? (9:37) – EU AI Act & Kennzeichnung KI-generierte Inhalte sollen gekennzeichnet werden.Problem: Definition knüpft am Werkzeug (KI) an, nicht an Authentizität.Gefahr: Inszenierte Fotos gelten als „echt“, KI-Bilder als „Fake“.Forderung: Durchgängige Metadaten statt reiner KI-Markierung. (21:03) – Politische KI-Beispiele KI-Inszenierungen mit historischen Figuren.Manipulierte Bilder aus politischen Kontexten.Polizeiliche KI-Symbolbilder zur Emotionalisierung.Problem: Behörden erzeugen eigene Bildrealitäten – Glaubwürdigkeit leidet. (27:10) – KI-Erkennung scheitert Studie zeigt: Chatbots erkennen KI-Videos nicht zuverlässig.→ Technische Erkennung allein reicht nicht. (29:06) – Neue Kennzeichnungsideen Vorschlag: Transparenz nachAutorenschaftAusführungVerfeinerungVerifikation (Mensch/KI/Assisted).Ansatz: Medienübergreifendes System statt einfacher „KI“-Labels. (35:44) – Vertrauenskrise neu definiert „Lügner-Dividende“: Echte Bilder können als KI-Fake diskreditiert werden.KI-Restaurierungen verändern reale Personen subtil.Notwendig: Vertrauenszonen je nach Kontext (Journalismus, Werbung, freie Kunst). (38:48) – KI-Nutzung weltweit Microsoft-Studie zeigt:Hohe Nutzung in VAE und Singapur.Deutschland im Mittelfeld.USA nicht führend bei Nutzung.Digitalisierte Staaten adaptieren schneller. (41:37) – Kreative vs. KI-Training Initiativen gegen ungefragtes Training mit urheberrechtlich geschütztem Material.Beispiel: Bücher werden gekauft, gescannt, zerstört – rechtlich zulässig in den USA. (44:54) – Risiken: Doom-Szenario oder Realismus? Essay von Dario Amodei (CEO Anthropic):Risiken durch Überwachung, Autoritarismus, Missbrauch.Weniger Superintelligenz, mehr reale Machtfragen.

    50 min
  5. Feb 2

    #12 Vom neuen Realismus zur Zukunft des EU AI Acts | Zu Gast: Sabine Richly

    Zum Jahreswechsel überbieten sich amerikanische und chinesische Anbieter mit neuen Modellen. OpenAI versucht mit ChatGPT 1.5 an die Modelle von Google und Bytedance Anschluss zu finden. Hautunreinheiten sind wieder begehrt: Higgsfield, Magnific und Topaz bieten einen "Skin Enhancer" für einen neuen Realismus. Im Videobereich arbeiten sich chinesische Modelle immer näher an Google VEO 3.1 heran. Ali Baba Cloud bietet Wan 2.6 mit Sound, Bytedance bietet mit Seedream 1.5 Pro ein Videomodell mit Sound, Multiframe und Storyboard, das eine echte Konkurrent geworden ist. Wir schauen auf das viral gewordene KI-Weihnachtsvideo von McDonald, die Jahresansprache des Instagram CEO zur Zukunft der Contentproduktion und unterhalten uns mit unserem Gast Sabine Richly über den aktuellen Stand des EU AI Acts. ... Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. LINKS: ⁠Rechtsanwältin Sabine Richly⁠MacDonalds SatireIPTCKI-Bilder KonvergenzHIGHLIGHTS: (00:08) - Selbstironischer Start (01:19) - KI-Weihnachtswerbung & Backlash: Coca-Cola: mittelmäßig, McDonald’s NL: massiver Shitstorm.Spot „The Most Terrible Time of the Year“: Anti-Weihnachtsbotschaft + KI-Look → Ablehnung.Verteidigung der Agentur („Our fingers hurts from typing prompts“) wird Meme.Cleveres Reaction-Video einer anderen Agentur kontert KI mit KI, thematisiert Copyright & Austauschbarkeit von KI-Figuren.(06:20) - Disney & OpenAI: Disney lizenziert Charaktere und investiert nach vorheriger Drohkulisse.Strategie: erst alles zulassen, Markt schaffen, dann lizensieren.Fanfiction wird Marketing-Asset (UGC 2.0). Profit vor allem für große Player.(10:44) - Metadaten & Transparenz: IPTC 25.1 führt detaillierte KI-Felder ein (Modell, Version, Prompt etc.).Wichtig für kommende Kennzeichnungspflichten; offen bleibt, ob IPTC, C2PA oder anderes Standard wird.Politik: mögliche Verzögerungen wegen „Komplexität“.(14:34) - Tool- & Modell-Update: ChatGPT Images: wenig Innovation, klarer Fokus auf Mainstream-User.Marktführer aus Praxis: Google (Nano Banana Pro) & ByteDance (Seedream 4.5).Trend: Realismus-Nachbearbeitung (Skin Enhancer, Pickel als „Echtheitsmarker“).Video: Kling mit starkem Sound-Generator; Foley wird automatisiert.Higgsfield Angles: Bilder als latente 3D-Räume → neue Perspektiven aus 2D.Video-Modelle: ByteDance und Google aktuell vorne; kein „bestes Modell“, alles use-case-abhängig.(29:46) - Instagram & Authentizität: Insta CEO Adam Mosseri erklärt Hochglanz-Ästhetik für tot.Widerspruch: Auch „unperfekt“ kann KI faken.Idee: Reservate für echte Fotos wären sinnvoller als noch mehr Realismus.(34:35) Zu Gast: Sabine Richly EU AI Act: Code of Practice zu Transparenz/KennzeichnungKennzeichnung maschinenlesbar, nicht sichtbar fürs Auge.Problem: Freiwilligkeit, geopolitische Spannungen, Durchsetzung.Plattformen (Deployers) sollen visuelle Labels einblenden.Deepfake-Begriff unscharf; Rechtsprechung wird nachschärfen.

    55 min
  6. 12/15/2025

    #11 Zum Jahresende überbieten sich alle mit neuen Modellen

    Zum Jahresende zeigt sich eine massive Beschleunigung der generativen KI: Drei Jahre nach ChatGPT ist der Markt fragmentierter und professioneller geworden. Im Bildbereich setzt sich das chinesische Modell Seedream 4.5 gegen Googles Nano Banana Pro durch, vor allem durch höhere Prompt-Treue und bessere Eignung für professionelle Workflows, während Detailverliebtheit allein nicht mehr reicht. Mit Flux 2 und Z-Image versuchen zwei Open Source Modelle dazu aufzuschließen. Bei Video-KI eskaliert der Wettbewerb mit neuen Editing-, Audio- und Cameo-Funktionen, wobei Google (Veo) aktuell vorne liegt, die chinesische Modellen von Kling (O1 und 2.6) aber mit weniger Zensur aufholen. Runway veröffentlich Gen 4.5. Parallel verschieben sich die Grundfragen: Urheberrecht, Regulierung, journalistisches Vertrauen und kulturelles Erbe werden zur eigentlichen Frontlinie – nicht die nächste Modellversion. Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. LINKS: Symposium des Deutschen Fotorates, Hamburg, 21.11.2025 HIGHLIGHTS: 00:00:08 | Rückblick auf November/Dezember, 3 Jahre ChatGPT / generative KI. 00:04:03 | Black Forest Labs: 3-Mrd-Bewertung, europäische Grundlagenarbeit, Substanz vs. Marketing. 00:05:48 | Neue KI-Bildmodelle & erste Einordnung: FLUX 2: Gutes Open-Source-Modell - aber schwächer als Konkurrenz.Microsoft MAI: angekündigt, noch ungetestet.Nano Banana Pro (Google) vs. Seedream 4 → 4.5 (ByteDance). Z-Image Turbo (Alibaba): Open Source, lokal, offline, schnell, wenig Zensur. 00:08:43 | Video-KI-Overkill Ende Nov / Anfang Dez: Runway 4.5 angekündigt, ab Mitte Dezember verfügbarKling Omni (O1): nachträgliches Video-Editing per Prompt & Referenz.Vergleich zu Sora 2 Cameo / Veo: Deepfake-Potenzial, erste Demos.Kling 2.6: Video + Ton + Sprache + Musik (stark bei Musik, schwach bei Schauspiel).Zwischenfazit Video: Veo 3.1 vorne, Kling holt auf, Zensur als Faktor. 00:12:39 | Geopolitik & Zensur: Chinesische Modelle: günstiger, weniger zensiert, Open-Source-Strategie als Marktangriff.Persönliches Nutzungsfazit: Bild = China vorn, Video = China schließt auf. 00:14:10 | Großer Bild-Modell-Vergleich: Nano Banana Pro vs. Seedream 4.5 Style- & Color-Transfer: Prompt-Verständnis als Schwachstelle.Renaissance des Textprompts beim Prompt Editing.Corporate / Auftrags-Usecases: Seedream stabiler, Nano Banana detailverliebt.Rollen-Prompts („Du bist Helmut Newton“): Referenztreue vs. Stilfreiheit.Usecase Werbung 00:26:16 | Vorhergehender Test Nano Banana Pro vs Seedream 4.0 00:29:06 | Klares Jahresfazit: Seedream 4.5 aktuell bestes Modell für Prompt Editing. 00:29:13 | Strategische Positionierung der Player: OpenAI: Masse, Gamification, Social.Google: professionelle Tools, Infografiken, strukturierte Prompts. 00:32:10 | Kreativer Prozess & Bewertung Google-Ansatz: KI evaluiert eigenen Output gegen Prompt.Kernproblem: Automatisierung vs. Mittelmaß. China-Studie: Juniors → Ideen, Seniors → Bewertung & Feinschliff.Kreativität, Stil, Vorhersehbarkeit, Comedy-Experimente. 00:38:30 | Mitarbeit in UNESCO-Arbeitsgruppe: KI-Werke & Weltkulturerbe. 00:39:30 | Urheberrecht & Rechtspolitik: Provokation: „Entertaste = Auslöser“ → menschliche Autorschaft.Gefahr juristischer Scheinpräzision (Prompt-Länge, Iterationen).USA vs. EU: Deregulierung, Zölle, Machtkampf.GEMA vs. OpenAI: Präzedenzfall Trainingsdaten.Historischer Exkurs: Fake-Image-Debatte schon 1912. 00:47:20 | Das Symposium des Fotorates: AI Act & „Deepfake“-Kennzeichnung: Begrifflich und praktisch problematisch.Branchenreaktionen (Werbung, Amazon).Vertrauensverlust: „Ich glaube euch kein Bild mehr.“Konsequenz: Provenienz, Signaturen, Verifikation.Vision: Foto-„Reservate“, redaktionelle Standards, Vertrauen statt Label-Inflation.

    56 min
  7. 11/15/2025

    #10 Von Authentizität zur Zukunft der Bildagenturen | Zu Gast: Alexander Karst

    Wie verändert sich die Bildagentur-Landschaft durch KI? Unser Gast ist diesmal Alexander Karst, Geschäftsführer von "DieBildbeschaffer" und Berater für "Bildrecherche, Bildeinkauf,Bildrechte, Lizenzierung und Archivierung."  Wir sprechen mit ihm über den Wandel derletzten Jahre und was KI für Bildagenturen und Bildberater*innen bedeutet. Dazugibt es einen vollgepackten Rückblick auf alle Neuerungen bei KI-Bild undVideomodellen - und ein Special zum Thema "Prompt-Editing".   Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter derArbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und BorisEldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelleAuswirkungen von KI auf Fotografie.   LINKS: Die Bildbeschaffer: https://www.die-bildbeschaffer.de Symposium des Deutschen Fotorats: Dr.Jürgen Scriba über"Bildjournalismus im Zeitalter Generativer KI"https://www.youtube.com/watch?v=MYxDe9I2IH8&t=8628s   HIGHLIGHTS:   (00:00) - Start (00:08) - Einstieg: Ausstellungen, Hamburg-Fotorat & erste Video-Experimente(03:10) - KI-Bubble, Geldkreislauf & Nvidia: Blase oder Investitionswelle? Kapital zirkuliert bei Big Playern, Nvidia profitiert durch Chips + CUDA. Ideen: Orbital-Rechenzentren, Teslas als verteiltes Compute.(06:30) - Authentizität, KI-Kamera & Canva/Affinity: Sony-Firmware unterscheidet reale 3D-Szenen von abgefilmten Screens.KI-Kamera als iPhone-Add-on mit generativen Filtern.Canva kauft Affinity; Suite quasi gratis, Monetarisierung über KI-Abos.(09:30) - Preisverfall bei Aggregatoren: Preise stürzen: Gratisjahre, Flatrates, APIs statt eigener Modelle.China drückt Preise, Markt wird laut und unübersichtlich.(12:30) - Bildmodelle & Prompt Editing: Neue Modelle: Qwen Edit, Seedream4, Reve, Nano Banana.Rollenprompting, Negatives ohne Extrafelder, neue Referenzen.Camera Angle Control rekonstruiert Blickwinkel.Fall „Afghan Girl“ auf der Paris Photo: neue Perspektive oder Aneignung?(17:10) - Videotrends & latente 3D-Räume: Veo 3.1 ändert Kamera nachträglich; ChronoEdit baut 3D aus fünf Frames.Trend: Bilder/Videos als rekonstruierte 3D-Szenen.Abo-Frage: Einzeltools vs. Aggregatoren (Runway nutzt Fremdmodelle).(21:10) - Fun Facts: China-Namen, Branding & Sora Kulturelle Modellnamen, neue Modelle (Flux 2, Microsoft).Branding: „Nano Banana“ vs. „ChatGPT Image“.Sora 2 mit Cameo-Cloning, jetzt auch Android.(26:01) - Zu Gast: Alexander Karst („Die Bildbeschaffer“): Beratung, Recherche, Lizenzen; Ex-Getty.Disruptionen: Krise, Napster, Fotolia, SocialKI als nächste Welle.(31:00) - KI vs. Stock: KI ersetzt generischen Stock, Reportage bleibt.Adobe trennt Stock/Firefly; Stock wird Massenware, Markt kippt zu Großkunden.(34:30) - Qualität, Geschmack & Übersättigung: Generieren schlägt Suchen; ohne Auge entstehen Fehler.Bewertung wird zentral: Kultur, Kontext, Marke.KI und Stock verschmelzen; Kennzeichnung kommt.(41:00) - Ausblick: Weg vom Einheitsbrei zur eigenen Bildsprache.Gute Bilder kosten – KI oder Kamera.Handwerk bleibt, C2PA rückt näher. Fazit: dranbleiben.

    44 min
  8. 10/15/2025

    #09 Von "Versäumten Bildern" zu versäumtem Copyright | Zu Gast: Dr Anke Schierholz, Gesine Born, Dr Phillip Ströbel

    Im Fokus diesmal: Die Verwendung von KI zur Erstellung historisch anmutender Bilder. Zu Gast sind Gesine Born mit ihrem Projekt "Versäumte Bilder", Dr.Philip Ströbel vom Historischen Seminar der Universität Zürich der das Projekt "Re-Experiencing History" vorstellt und Dr. Anke Schierholz (VG Bildkunst) die aktuelle Copyright-Fragen mit Jürgen diskutiert. Wir sprechen über den Nano Banana Konkurrenten Seedream 4 und den Release von Sora 2. Im KI-Podcast unterhalten sich Dr. Jürgen Scriba, Leiter der Arbeitsgruppe "Technischer Fortschritt" / Deutscher Fotorat und Boris Eldagsen (Mitglied der Arbeitsgruppe) mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie.LINKS: "Versäumte Bilder" https://bilderinstitut.de/versaeumte-bilder-bmftr & https://bilderinstitut.de/versaeumte-bilder-bonn & https://bilderinstitut.de/versaeumte-bilder-darmstadt-1"Re-Experiencing History" https://tinyurl.com/ycevsnvz Arbeitsgruppe des Deutschen Fotorstes: https://deutscher-fotorat.de/arbeitsgruppen/technischer-fortschritt HIGHLIGHTS: (00:00) - Start (01:17) - Sora 2 dominiert den Monat: Release 1. Oktober; massiver Hype, Meme-Welle, kaum zu umgehen.Zugang via VPN & Invite; „Add Cameo“ (eigener Avatar), Altman-Cameo viral.Prompting ohne Skills; App als Social-Media-Produkt. Konkurrenz klar schwächer.„Null-Skill-Commercials“: Thema reicht, Spot entsteht automatisch.Qualität & Limits: starke Prompt-Treue, kurze Clips (10–15 s), viele Fehlschläge/Zensur.Remix als Killer-Feature.„AI-Share“ als neues Marketing-KPI.Rechtekontrolle faktisch Opt-out, Sperren leicht umgehbar.(18:00) - Politökonomie der KI: (23:04) - Bild-Modelle: China vorn Seedream4 (ByteDance) vor Google; Textprompt-Editing.China-Vorsprung wird im Westen unterschätzt.(25:49) - KI-Leaderboards: LM Arena: „Hunyuan“ (Tencent) rückt nach vorn.(28:08) - KI-Video: USA knapp vorn: Sora2 & Veo 3China dicht dahinter.(29:42) - Virtuelle Schauspielerin: „Tilly Norwood“ als Case für automatisierte Content-Pipelines.(33:54) - Katalogfotografie wird KI: Otto ersetzt Studio-Shoots; ~60 % Kostenersparnis.(37:57) - Zu Gast: Dr. Anke Schierholz, VG Bildkunst Fair Use & AnthropicUS-Settlement: KI-Training mit legalen Quellen zulässig („Freifahrtschein light“).(44:01) - Opt-outs & EU-TDM: Debatte um zentrales Opt-out; Bild-Granularität unklar.(48:12) - Kollektivlizenzen: Einzel-Opt-outs unrealistisch; Bedarf an gesetzlichen Lizenzen.(55:28) - Hoffnung auf EuGH: Klarstellung nötig, sonst „Internet = Gemeinfreiheit“.(59:06) - Zu Gast: Gesine Born, Bilderinstitut Berlin „Versäumte Bilder“: Ergänzt fehlende Frauenportraits; partizipativ, transparent.(01:13:13) - Akzeptanz & Zeitpatina: Technisches Altern vs. emotionale Fixierung; KI-Kennzeichnung wichtig.(01:20:19) - Kontrolle & Transparenz: Bilder entziehen sich Kontrolle → Prozess-Offenlegung nötig.(01:22:15) - Zu Gast: Dr. Phillip Ströbel, Universität Zürich: „Re-Experiencing History“KI-Rekonstruktionen via LoRA-Fine-Tuning; weniger Anachronismen, nie fehlerfrei.

    1h 37m

About

Im KI-Podcast unterhalten sich Dr. Jürgen Scriba und Boris Eldagsen mit wechselnden Gästen über aktuelle Auswirkungen von KI auf Fotografie. Medienkünstler Jürgen Scriba ist promovierter Physiker, war Wissenschaftsredakteur bei „Focus“ und „DER SPIEGEL“, Geschäftsführer DFA und leitet die Arbeitsgruppe technischer Fortschritt des Deutschen Fotorats. Boris Eldagsen ist international anerkannter Experte für KI-generierte Bilder. Seine Absage des Sony World Photo Awards löste 2023 eine weltweite Debatte aus. Er unterrichtet "KI für Kreative" an der LABASAD Barcelona.

You Might Also Like