Warum das Ziel wichtiger wird als der perfekte Prompt
Vor zwei, drei Jahren drehte sich alles um eine Frage: Wer schreibt den besten Prompt? Heute ist die eigentliche Frage laut Mark und Jens eine andere: Wer baut die beste Schleife, den besten Loop. Auslöser der Folge ist ein Zitat von Andrej Karpathy, der kürzlich öffentlich gemacht hat, dass Loop Engineering inzwischen wichtiger sei als Prompt Engineering. Mark zeichnet daraufhin seine eigene Entwicklung nach: von einer frühen Notion-Prompt-Datenbank ("Diskette war schon immer gut, wer will schon eine CD?") über Skills als Markdown-Dateien mit Sub-Skills und ausführbarem Python-Code bis zum eigentlichen Loop Engineering. Der Unterschied: Ein Loop bekommt kein einzelnes Kommando, sondern ein Ziel, klare Erfolgskriterien und die Anweisung, sich selbst so lange zu überprüfen und zu wiederholen, bis das Ziel erreicht ist.
Die praktische Warnung der Folge: Wer eine KI ihre eigene Arbeit prüfen lässt, bekommt oft nur Selbstbestätigung zurück. Mark und Jens plädieren deshalb dafür, das Ergebnis (das "Act") von einem anderen Modell checken zu lassen, statt von demselben System, das es erzeugt hat, denn ein System, das sich selbst belobigt, ist kein kritischer Beobachter. Als Beleg zitiert Mark einen Post von Peter Steinberger zu genau diesem Ansatz und dem dazugehörigen Tokenverbrauch. Darauf aufbauend ordnen die beiden aktuelle Funktionen wie Claude Codes Goal-, Loop- und Workflow-Modus ein, inklusive Marks eigenem Ablauf: erst planen, dann mit einem Kritiker- und einem Meta-Analyse-Skill gegenprüfen lassen, dann per Goal automatisiert umsetzen lassen, auch wenn das mal 10, 12 oder 20 Stunden dauert.
Ein wachsendes Thema in diesem Zusammenhang ist Harness Engineering. Je mehr Agenten und Loops parallel arbeiten, desto wichtiger werden Kontext und Memory (Stichwort "Second Brain", mit dem Beispiel der kurzfristigen Fable-Abschaltung als Warnung, wie schnell Kontext sonst verloren geht) sowie Governance-Fragen wie Auditierung und signierte Skills. Mark spinnt das Gedankenspiel humorvoll weiter zu einem "deutschen Behörden-Harness", der Bürokratie automatisiert und dadurch zum heimlichen Exportschlager werden könnte. Zum Abschluss grenzen die beiden Harness noch begrifflich von "Agentic OS" ab. Das Fazit der Folge: Es geht nicht darum, mit möglichst vielen Tokens zu beeindrucken, sondern ein klares Ziel zu definieren und der Maschine geduldig den Weg dorthin zu überlassen.
Informationen
- Sendung
- Veröffentlicht5. Juli 2026 um 00:59 UTC
- Länge46 Min.
- BewertungUnbedenklich
