Sicherheit dominiert heute: von kritischen Lücken in KI-Agenten-Infrastruktur über Deepfake-Verhaftungen bis zu halluzinierten Zitaten in Medizinleitlinien. Daneben treiben Routing-Effizienz, Open-Source-Realismus und die Frage, was Agenten außerhalb Dev-Tooling tatsächlich einsatzfähig macht, die Builder-Agenda. Die kritischste Nachricht des Tages kommt aus der Infrastruktur-Schicht: Die als „BadHost" bezeichnete Sicherheitslücke CVE-2026-48710 in Starlette — dem ASGI-Framework hinter FastAPI mit 325 Millionen wöchentlichen Downloads — erlaubt es Angreifern, durch ein einziges injiziertes Zeichen im HTTP-Host-Header die Authentifizierung zu umgehen. Betroffen sind vLLM, LiteLLM, MCP-Server und weite Teile des Python-KI-Ökosystems; im Worst Case droht Remote Code Execution. X41 D-Sec, die das Problem entdeckte, beschreibt die Schwere als kritisch — höher als das offizielle CVSS-Rating von 7/10 suggeriert. Ein laufender Scan des Unternehmens zeigt bereits exponierte klinische Datenbanken, Mailboxen, IoT-Zugänge und Cloud-Topologien. Das Patch auf Starlette 1.0.1 steht bereit. Parallel dazu dokumentiert Simon Willison eine strukturell verwandte Angriffsfläche: Bei Microsoft Copilot Cowork ermöglichte ein Prompt-Injection-Angriff die Exfiltration von OneDrive-Dateien über extern gerenderte Bilder in Agenten-E-Mails. Beide Fälle illustrieren dasselbe Grundproblem: Agenten, die eigenständig Netzwerkanfragen auslösen und Credentials verwalten, vergrößern die Angriffsfläche proportional zu ihren Fähigkeiten. Dass KI-Systeme auch in der Wissenschaft Schaden anrichten können, zeigt eine Studie aus dem Lancet: KI-halluzinierte Zitate infiltrieren zunehmend klinische Leitlinien-Forschung. Ein Audit von 2,47 Millionen biomedizinischen Papers aus dem PubMed-Central-Archiv (Januar 2023 bis Februar 2026) fand 4.046 fabrizierte Referenzen — die Rate stieg seit Mitte 2024 auf mehr als das Zwölffache des Ausgangswerts und lag Anfang 2026 bei 56,9 pro 10.000 Papers. Besonders heikel: Review-Artikel, die häufig als Basis für Behandlungsleitlinien dienen, weisen eine 57 Prozent höhere Fabrikationsrate auf als andere Papiertypen. 98,4 Prozent der betroffenen Publikationen hatten zum Zeitpunkt des Audits keine Reaktion ihrer Verlage erhalten. Die Forscher fordern automatisierte Referenz-Checks vor der Publikation sowie retroaktives Screening bereits veröffentlichter Arbeiten. Auf der Produkt- und Architekturseite verdichten sich die Zeichen, dass Effizienz und Modularität die nächste Differenzierungsebene werden. Der Cactus Hybrid Router — ein 65.000-Parameter-Modell — routet Anfragen zur Laufzeit zwischen dem lokalen Gemma4-2B und dem Cloud-basierten Gemini: Durch Weiterleitung von 15 bis 55 Prozent der Tasks in die Cloud soll die Qualität von Gemini-2.5-Flash-Lite erreicht werden, ohne jede Anfrage zu vollem Cloud-Preis abzurechnen. Komplementär dazu steht MEMO, ein modulares Framework für Wissensspeicherung ohne LLM-Parameteranpassung, entwickelt von Forschern der National University of Singapore, MIT CSAIL und A*STAR: Ein kleines, dediziertes Memory-Modell internalisiert neues Wissen, während das Haupt-LLM eingefroren und als Black Box behandelt wird — kein Catastrophic Forgetting, kein teures Retraining. In Experimenten fungiert Qwen2.5-14B-Instruct als Memory-Modell, Qwen2.5-32B-Instruct oder Gemini-3-Flash als Executive-Modell. Und Stability AI rundet das Bild mit Stable Audio 3 ab: Die Familie aus latenten Diffusionsmodellen — small, medium, lar…