Tes features IA en production ne donnent pas la fiabilité espérée et ton réflexe naturel c'est d'améliorer les prompts et complexifier le harness. Mais si le sujet était ailleurs ?
Claire Gouze est la cofondatrice et CEO de nao Labs où elle construit le premier agent open source dédié à l'analyse de données.
Sur ses propres agents, elle est passée de 15 % à 90 % de fiabilité grâce au context engineering.
Dans cet épisode, elle explique :
- Pourquoi un agent qui échoue est souvent le reflet d'ambiguïtés que ton équipe n'a jamais clarifiées sur sa propre data.
- La méthode concrète pour mesurer la fiabilité d'un agent en production : tests unitaires, ordres de grandeur réalistes, et ce qu'il faut tester en priorité.
- Le shift de fond : passer d'un monde où l'on jugeait le code à un monde où l'on juge l'output, et ce que ça change dans notre façon de construire les produits.
Pour recevoir mes analyses et ne pas manquer les prochains épisodes, pense à t'abonner à la newsletter sur justaclick.fr
Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.
Informations
- Émission
- FréquenceChaque semaine
- Publiée1 juin 2026 à 22:36 UTC
- Durée47 min
- ClassificationTous publics
