Beyond Vibe Coding

HMZE × Impala Search

Beyond Vibe Coding is a weekly podcast for senior engineering leaders navigating the impact of AI on how software gets built. Hosted by Sebastian Heide-Meyer zu Erpen and André Neubauer in partnership with Impala Search, each episode brings together the leaders shaping the next era of engineering - from how teams are adopting AI, to what changes for product and architecture, to what stays unchanged when the tools shift underneath us. New episodes weekly.

  1. #S2.01 Reliable AI Agents: A System Problem, Not a Model Feature - Csaba Tamas (Parloa)

    3d ago

    #S2.01 Reliable AI Agents: A System Problem, Not a Model Feature - Csaba Tamas (Parloa)

    Csaba Tamas joins Beyond Vibe Coding to explain what enterprise AI agents look like when they move beyond the demo stage. As CPO at Parloa, he works on customer experience automation where reliability, latency, traceability and sovereignty are not abstract concerns. They decide whether an AI agent can handle real customer conversations at scale. A core message of the episode is that agent reliability is a system problem. Csaba describes simulations and evaluations before production, agent observability after launch, policy engines for tool-call order, prompt analysis, multi-agent task decomposition and the constant latency trade-offs of voice experiences. He also explains why Parloa currently puts more energy into the harness around the model than into fine-tuning itself. The conversation ends with a grounded view of vibe coding. Csaba uses AI coding tools and even prototypes for work, but his most important lesson is that the human still needs domain expertise. The model can accelerate good judgment; it cannot replace the judgment needed to spot wrong architecture, rewritten tests or incomplete implementations. -- Links and ReferencesParloa: https://www.parloa.comCsaba Tamas on LinkedIn: https://www.linkedin.com/in/tamascsaba/Stanford Meta Harness Paper: https://arxiv.org/abs/2603.28052Impala Search: https://www.impalasearch.io/ The HMZE Podcast is a project by Sebastian Heide-Meyer zu Erpen and André Neubauer, partnering with Impala Search (www.impalasearch.io). The content is created by us and our guests. Join the discussion on LinkedIn or visit www.hmze.tech, where we publish all episodes. For questions and inquiries, feel free to contact us via LinkedIn⁠⁠. Thank you for your time and see you in the next episode.

    36 min
  2. Jun 4

    #065 Agentic Engineering - auch Big Tech hat noch keinen Plan

    In dieser Folge diskutieren Sebastian und André über den realen Stand des Agentic Engineering in größeren Tech-Organisationen. Basis ist ein Bericht, den Sebastian aus aktuellen Quellen, Unternehmensbeispielen, Konferenzvorträgen und früheren HMZE-Folgen erstellt hat. Das wichtigste Fazit ist, dass Agentic Engineering nicht einfach nur ein besseres Coding-Tool ist. Es handelt sich um eine Änderung des Betriebsmodells, die einen neuen „Middle Loop“ zwischen dem Coden und der Delivery von Produkten und Features schafft. Während die Erfolgsmessungen der Unternehmen alle erhöhten Throughput zeigen, sieht es beim Business Impact schon anders aus. Keine der Organisationen hat bereits messbare Erfolge vorzuweisen - mit Ausnahme sicher von Anthropic, die auch mit einem sehr sehenswerten Talk vertreten sind. Die Obsession auf Tokenmaximierung scheint vorbei. Mehr KI-gestützte PRs, mehr generierte Diffs und ein höherer Token-Verbrauch führen nicht automatisch zu geschäftlichen Auswirkungen. Uber ist hier sicher derzeit die sichtbarste Firma, wenn es um derartige Kritik geht. Ein wichtiges Thema ist technische Exzellenz. Agenten beschleunigen das System, das ihnen zugrunde liegt. Starke CI/CD, Testabdeckung, Observability, Zugriffskontrolle, Review-Disziplin und klare Verantwortlichkeiten schaffen Hebelwirkung; schwache Fundamente führen zu schnelleren Fehlermodi. Die Folge befasst sich auch mit Sicherheits- und Compliance-Mustern wie RBAC, Sandboxing, Berechtigungen im Impersonation-Stil, Datenklassifizierung, Zero-Data-Retention-Beschränkungen und Model-Routing. Schließlich werfen Sebastian und André einen Blick auf Kosten- und Souveränitätsfragen, einschließlich Frontier-Modellen, Open-Weight-Modellen, lokaler Inferenz und der Frage, warum selbst die größten Unternehmen Agentic Engineering in großem Maßstab noch nicht vollständig gelöst haben. -- Links und Referenzen Der Report — https://hmze.tech/assets/2026-06-01_Agentic_Engineering_Report.pdf The Pragmatic Summit - https://www.pragmaticsummit.com/Code with Claude Conference - https://claude.com/code-with-claude/san-franciscoThoughtworks: “Future of Software Development Retreat - Key Takeaways” - https://www.thoughtworks.com/content/dam/thoughtworks/documents/report/tw_future%20_of_software_development_retreat_%20key_takeaways.pdfCloudflare: “The AI engineering stack we built internally” - https://blog.cloudflare.com/internal-ai-engineering-stack/ Der HMZE Podcast ist ein Projekt von Sebastian Heide-Meyer zu Erpen und André Neubauer. Die Inhalte stammen von uns und unseren Gästen. Weiterdiskutieren kannst du bei LinkedIn oder besuche uns auf unserer HMZE Seite, wo wir alle Folgen veröffentlichen. Fragen und Anfragen kannst du uns gerne per Mail an ⁠⁠ schicken. Vielen Dank für deine Zeit und bis zur nächsten Folge.

    45 min
  3. #064 Software Factory by Enpit - mit Ulrich und Andreas

    May 29

    #064 Software Factory by Enpit - mit Ulrich und Andreas

    Ulrich Gerkmann-Bartels und Andreas Koop von enpit bringen eine selten konkrete Perspektive in die Dark-Factory-Debatte: Sie haben nicht mit einer Vision angefangen, sondern mit einem internen HR-Problem. Eine SaaS-Lösung war für ihre Größe zu breit und zu teuer; daraus entstand der Versuch, mit Agentic Engineering eine eigene Lösung produktiv zu bauen - inklusive echter Anforderungen, Product Owner, Security-Themen und Kündigungsdruck. Im Zentrum steht ihre „Digital Product Factory“: ein Kanban-basiertes System, in dem Backlog, Clarify, Ready, Doing, Review und Done nicht nur menschliche Prozessschritte sind, sondern Agentenarbeit, Spezifikation, Tests, Merge Requests, Logs, Diffs und Qualitätsmetriken zusammenführen. Interessant ist der Shift nach links: Der erste Wertbeitrag des Agenten ist nicht der Code, sondern bessere Rückfragen, präzisere Edge Cases und eine sauberere Spezifikation. Der Reality Check der Folge ist deutlich: Ohne Sandbox, Security-Gates und unabhängige Kontrolle wird Agentic Engineering riskant. Gleichzeitig relativieren Ulrich und Andreas Tool-Hype rund um RAG und MCP und kommen zu einer nüchternen Prediction: Software-Factories werden kommen, aber IDEs, Menschen und Engineering-Verantwortung verschwinden nicht. Das Zusammenarbeitsmodell verändert sich. -- Links und Referenzen enpit: https://enpit.de/Conductor: https://www.conductor.build/Claude Code Sandboxing / Security: https://www.anthropic.com/engineering/claude-code-sandboxingPeter Steinberger – Just Talk To It: https://steipete.me/postsRalf D. Müller - Prompt Injection by the maintainer of jqwik: https://www.linkedin.com/feed/update/urn:li:activity:7465696005691428864/  Der HMZE Podcast ist ein Projekt von Sebastian Heide-Meyer zu Erpen und André Neubauer. Die Inhalte stammen von uns und unseren Gästen. Weiterdiskutieren kannst du bei LinkedIn oder besuche uns auf unserer HMZE Seite, wo wir alle Folgen veröffentlichen. Fragen und Anfragen kannst du uns gerne per Mail an ⁠⁠ schicken. Vielen Dank für deine Zeit und bis zur nächsten Folge.

    1h 2m
  4. #063 FinTech und AI-Vorreiter - mit Florian Thiel (Upvest)

    May 23

    #063 FinTech und AI-Vorreiter - mit Florian Thiel (Upvest)

    Florian Thiel, Director of Engineering bei Upvest, gibt einen sehr konkreten Einblick in Agentic Engineering in einem regulierten FinTech. Upvest baut Investment-Infrastruktur per API und muss mit Bank-/Finanzmarktanforderungen, Kundendaten, Auditierbarkeit und komplexen End-to-End-Flows umgehen. Gerade deshalb ist die Episode spannend: Viele Strukturen, die klassisch als Bremse gelten - Human Review, Pull-Request-Gates, Datenklassifikation, SSO und kontrollierte Zugriffe - werden bei Upvest zur Voraussetzung für sicheren AI-Einsatz. Im Gespräch geht es um Claude Code, Gemini, ein internes AI Toolkit mit Skills, Rules, Workflows und Agents, MCP-Gateways mit Nutzerrechten, Datadog- und Linear-Anbindungen, Developer-Experience-Messung mit DX sowie die Frage, wie viel Produkt-, Domain- und Architekturwissen Agenten brauchen. Florian bleibt dabei sehr pragmatisch: AI erhöht Durchsatz, aber die Code-Qualität ist tlw. durchwachsen, Review-Bottlenecks, unvollständige Test-Harnesses, Agent Sprawl und Kontextmanagement sind noch ungelöst. Die wichtigste Lehre: Agentic Engineering ist keine reine Toolfrage. Organisationen, die heute profitieren wollen, brauchen eine saubere Engineering-Basis: kleine und konsistente Stacks, automatisierte SDLC-Gates, gute Dokumentation, versionierten Kontext und klare Governance. Dann kann Regulierung sogar zum Vorteil werden, weil die nötigen Sicherheits- und Kontrollmechanismen bereits existieren. -- Links und Referenzen Upvest: https://upvest.co/Cloudflare Model Context Protocol / MCP Portal: https://developers.cloudflare.com/cloudflare-one/access-controls/ai-controls/mcp-portals/ Datadog MCP Server: https://docs.datadoghq.com/bits_ai/mcp_server/Linear MCP: https://linear.app/docs/mcpDX Developer Intelligence Platform: https://getdx.com/ Der HMZE Podcast ist ein Projekt von Sebastian Heide-Meyer zu Erpen und André Neubauer. Die Inhalte stammen von uns und unseren Gästen. Weiterdiskutieren kannst du bei LinkedIn oder besuche uns auf unserer HMZE Seite, wo wir alle Folgen veröffentlichen. Fragen und Anfragen kannst du uns gerne per Mail an ⁠⁠ schicken. Vielen Dank für deine Zeit und bis zur nächsten Folge.

    1h 7m
  5. May 13

    #062 Ein Deep-Dive in Dark Factories (audio fix)

    Dark Factories beschreiben ursprünglich vollautomatisierte Fabriken ohne Menschen auf dem Shopfloor. In Software wird der Begriff inzwischen für Level-5-Entwicklung verwendet: Ziel oder Spezifikation rein, Software raus. Sebastian und André diskutieren, warum dieses Bild hilfreich ist – und wo es in die Irre führt, weil Softwareentwicklung häufig neue, schlecht definierte Probleme löst statt stabile Produktionsprozesse zu wiederholen. Im Zentrum steht der Unterschied zwischen echter L5-Architektur und unreviewter Codegenerierung mit Marketinglabel. StrongDM dient als wichtiges Referenzbeispiel: Specs, Harnesses, Digital-Twin-Umgebungen und unabhängige Szenarien machen „no human review“ überhaupt erst diskutierbar. Ohne diese Struktur bleibt der Schritt riskant, besonders für Organisationen, die heute eher auf L2 oder L3 arbeiten. Für Tech Leader wird Spec Writing zur Schlüsselfähigkeit. Der Bottleneck wandert von Code zu Verhalten, Akzeptanzkriterien, Validierung und Produkturteil. Gleichzeitig bleiben menschliche Guardrails wichtig: datengetriebene Produktloops können Innovation beschleunigen, aber auch Nutzer überfordern und Enshittification beschleunigen. -- Links und Referenzen StrongDM Software Factory: https://factory.strongdm.aiSimon Willison über StrongDMs Software Factory: https://simonwillison.net/2026/Feb/7/software-factory/Dan Shapiro: The Five Levels from Spicy Autocomplete to the Dark Factory: https://www.danshapiro.com/blog/2026/01/the-five-levels-from-spicy-autocomplete-to-the-software-factory/Stanford CodeX: Built by Agents, Tested by Agents, Trusted by Whom?: https://law.stanford.edu/2026/02/08/built-by-agents-tested-by-agents-trusted-by-whom/strongdm/attractor auf GitHub: https://github.com/strongdm/attractorstrongdm/attractorbench auf GitHub: https://github.com/strongdm/attractorbench

    1h 4m
  6. #061 Das Eichhorst Prinzip - mit Ingo Eichhort (IONOS)

    May 7

    #061 Das Eichhorst Prinzip - mit Ingo Eichhort (IONOS)

    Ingo Eichhorst bringt in dieser Episode einen nützlichen theoretischen Rahmen für AI Coding auf den Punkt. Er beschreibt LLMs als verrauschte Kanäle, in denen Unschärfe schon vor dem Modell entsteht, nämlich in Sprache, Anforderungen, Kontext und impliziten Annahmen. Das Eichhorst-Prinzip ist deshalb vor allem eine Denkstütze dafür, an welchen Stellen Teams tatsächlich Qualität beeinflussen können. Spannend wird die Folge vor dort, wo Ingo die Theorie auf reale Engineering-Arbeit zurückführt. Er spricht über Go als agentenfreundliche Sprache, über kleine iterative Arbeitspakete statt überladene Spec-Rituale, über Datenschutz und Datenklassifizierung als organisatorische Leitplanken und über die Bedeutung von Tests, Linter, Compiler und Architektur-Checks. Die Kernaussage ist klar: Wenn AI mehr Code erzeugt, muss das System drumherum mehr Qualität absichern. -- Links und Referenzen Irrlicht: https://github.com/ingo-eichhorst/IrrlichtTaskmaster: https://tryhamster.com/product/taskmasterClaude Shannon: https://en.wikipedia.org/wiki/Claude_ShannonInformation entropy: https://en.wikipedia.org/wiki/Entropy_(information_theory)Precision and recall: https://developers.google.com/machine-learning/crash-course/classification/accuracy-precision-recall Der HMZE Podcast ist ein Projekt von Sebastian Heide-Meyer zu Erpen und André Neubauer. Die Inhalte stammen von uns und unseren Gästen. Weiterdiskutieren kannst du bei LinkedIn oder besuche uns auf unserer HMZE Seite, wo wir alle Folgen veröffentlichen. Fragen und Anfragen kannst du uns gerne per Mail an ⁠⁠ schicken. Vielen Dank für deine Zeit und bis zur nächsten Folge.

    1h 19m
  7. #060 AI für den Wald - mit Alexander Thiele (ocell)

    Apr 30

    #060 AI für den Wald - mit Alexander Thiele (ocell)

    Alexander Thiele beschreibt in dieser Episode eine begeisternde Form von AI-Transformation. Bei ocell geht es um Waldflächen, Luftbilder, GeoJSON, Offline-first-Anwendungen und Prozesse, die mit unstrukturierten Daten, operativen Übergaben und realen Produktivitätsgrenzen zu tun haben.  Besonders interessant ist Alexanders Blick auf die Organisation. Er beschreibt, wie Claude nicht nur Engineers hilft, sondern auch Product, Customer Success, HR und Marketing. Plugins, Skills und Sub-Agents werden dabei nicht als magische Lösung verkauft, sondern als praktische Mittel, um Zugangshürden zu senken, Arbeit anschlussfähiger zu machen und Teams neue Formen von Ownership zu ermöglichen. Damit wird die Folge vor allem für Tech- und Produktverantwortliche relevant, die gerade nicht mehr nur über Tools, sondern über echte Betriebsmodelle für AI-unterstützte Wissensarbeit nachdenken. Gleichzeitig bleibt die Episode angenehm ehrlich über Grenzen und Reibung. Das Innovationstempo ist hoch, nicht jedes Tool hält, was es verspricht, und der Wunsch nach einem wirklich integrierten Personal Assistant ist noch nicht eingelöst. Gerade diese Mischung aus Begeisterung, Pragmatismus und offener Unsicherheit macht das Gespräch stark. -- Links und Referenzen ocell: https://www.ocell.io/Flutter: https://flutter.dev/Graphiti: https://github.com/getzep/graphitiFlutterCon Talk zu Offline First: https://www.youtube.com/watch?v=QCwwKWm9UDQ Der HMZE Podcast ist ein Projekt von Sebastian Heide-Meyer zu Erpen und André Neubauer. Die Inhalte stammen von uns und unseren Gästen. Weiterdiskutieren kannst du bei LinkedIn oder besuche uns auf unserer HMZE Seite, wo wir alle Folgen veröffentlichen. Fragen und Anfragen kannst du uns gerne per Mail an ⁠⁠ schicken. Vielen Dank für deine Zeit und bis zur nächsten Folge.

    1h 2m

About

Beyond Vibe Coding is a weekly podcast for senior engineering leaders navigating the impact of AI on how software gets built. Hosted by Sebastian Heide-Meyer zu Erpen and André Neubauer in partnership with Impala Search, each episode brings together the leaders shaping the next era of engineering - from how teams are adopting AI, to what changes for product and architecture, to what stays unchanged when the tools shift underneath us. New episodes weekly.

You Might Also Like