Decideo - Data Science, Big Data, Intelligence Augmentée

Philippe Nieuwbourg

Decideo est la communauté d'information et d'échange autour des outils et meilleures pratiques d'analyse de données (Machine Learning, Business Intelligence, Big Data, Science des Données, Entrepôts de données…). Véritable réseau social des professionnels de la donnée, Decideo est disponible en français www.decideo.fr et en espagnol www.decideo.com. Opinions d'experts, actualités, agenda, offres d'emploi, sont disponibles en ligne et sur les applications mobiles gratuites. Decideo is the leading user community of Business Intelligence, Data Science, Big Data and Analytics professionals. Decideo is a real social network of data driven economy, available in French www.decideo.fr, and Spanish www.decideo.com. User stories, best practices, news, software reviews, agenda, job board… are available online, and through podcast and mobile applications.

  1. #6.12 Mauvaise gouvernance : Faut-il interdire ou empêcher ?

    18 may

    #6.12 Mauvaise gouvernance : Faut-il interdire ou empêcher ?

    Interdire ou empêcher : deux logiques de gouvernance à l'épreuve des données et de l'IA De passage sur TikTok pour y écouter parler de philosophie (si, si, on parle de philo sur TikTok… abonnez-vous par exemple au compte de @philo_sophia_) l'algorithme m'a conduit à une comparaison argumentée entre l'interdiction et l'empêchement. Faisant le parallèle avec les contextes de gouvernance des données et de l'intelligence artificielle, qui semblent si difficiles à faire accepter aux opérationnels, il m'a semblé porteur de poser quelques réflexions sur le thème : faut-il imposer ou proposer une gouvernance des données ? Faut-il interdire ou empêcher une mauvaise, ou l'absence de gouvernance ? Une distinction conceptuelle aux implications politiques majeures La distinction entre interdire et empêcher paraît, au premier abord, triviale ; elle structure pourtant en profondeur les deux grands régimes de régulation possibles dans une société technologisée. Interdire est un acte normatif. La règle s'adresse à un sujet supposé libre, capable de comprendre la norme, d'en délibérer et, le cas échéant, d'y contrevenir. L'interdiction présuppose la possibilité matérielle de la transgression : c'est précisément cette possibilité qui ouvre l'espace de la responsabilité, du jugement, de la sanction et corrélativement de la contestation. Lawrence Lessig identifie ainsi la loi comme l'une des quatre modalités de régulation, qui contraint par la menace de la sanction, aux côtés des normes sociales, du marché et de l'architecture. Empêcher, à l'inverse, relève d'un dispositif factuel : la conduite n'est pas réprouvée, elle est rendue impossible. Aucun sujet n'a à délibérer, aucun juge n'a à trancher, aucun contrevenant n'a à répondre. Dans le cyberespace, cette modalité est portée par le code informatique lui-même. Lessig démontre que le code, et l'architecture, définissent la manière dont nous vivons le cyberespace, et détermine s'il est facile ou non de protéger sa vie privée, ou de censurer la parole. L'architecture remplace la délibération par la configuration. La portée critique de cette distinction a été remarquablement développée par Alain Supiot dans La Gouvernance par les nombres (Fayard, 2015). Il y montre comment la loi cède la place au programme et la réglementation à la régulation, dans un imaginaire institutionnel où l'on viserait la réalisation efficace d'objectifs mesurables plutôt que l'obéissance à des lois justes. L'enjeu, pour Supiot, n'est pas seulement technique : en envisageant les hommes comme des ordinateurs programmables, la gouvernance par les nombres sape le règne de la loi et fait ressurgir un système d'allégeance quasi féodal. Là où la loi suppose un sujet juridique responsable, le programme suppose un comportement à conditionner. Mon opinion : pour une primauté de l'interdiction sur l'empêchement Au terme de cette analyse, je défends la thèse suivante : dans la gouvernance des données et de l'IA, l'interdiction doit être première, l'empêchement instrumental. Mais c'est à vous de me dire dans les commentaires si vous êtes en accord avec cette vision… ou pas. Cette hiérarchie repose sur trois raisons. D'abord, une raison de principe démocratique. L'interdiction émane d'une délibération publique ; elle peut être discutée, amendée, abrogée. L'empêchement, lorsqu'il est inscrit dans le code, échappe à cette publicité : il est défini par les concepteurs, souvent privés, et son fonctionnement est opaque pour la majorité. Substituer systématiquement le dispositif à la norme, c'est déplacer la souveraineté politique vers les architectes techniques, ce que Supiot identifie comme une régression institutionnelle majeure. Ensuite, une raison anthropologique. L'interdiction maintient ouvert l'espace dans lequel l'agent peut choisir d'obéir ou de transgresser, et donc peut être tenu pour responsable. Un monde de pure prévention technique est un monde sans sujets moraux. Or, comme le rappellent Rouvroy et Berns, sans cet espace, c'est la possibilité même de la subjectivation politique qui s'efface et avec elle, paradoxalement, toute critique du système. Big Brother et George Orwell ne sont plus très loin… Enfin, une raison d'efficacité réflexive. Les dispositifs techniques sont faillibles, biaisés, contournables, et leurs erreurs se diffusent à grande échelle. La norme, parce qu'elle s'applique à des cas concrets via le jugement, conserve une plasticité que le code ne possède pas. Réserver à la loi le rôle de fixer ce qui doit être interdit, et au dispositif celui de rendre cette interdiction matériellement effective lorsque les asymétries d'échelle l'exigent, permet de cumuler les avantages des deux régimes sans en payer tous les coûts. Cela ne signifie pas qu'il faille rejeter l'empêchement technique. Face au passage à l'échelle des systèmes d'IA, à la rapidité des traitements automatisés, à l'asymétrie d'information entre opérateurs et personnes concernées, l'interdiction seule serait souvent purement déclaratoire. Le RGPD et l'AI Act ont raison de combiner les deux registres. Mais l'ordre de priorité importe : le dispositif doit servir la norme, et non la remplacer. Concrètement, cela impose trois critères à tout empêchement by design : Traçabilité juridique : le dispositif doit pouvoir être référé à une norme publique, débattue et amendable. Contestabilité effective : la personne empêchée doit pouvoir comprendre qu'elle l'est, savoir pourquoi, et disposer d'un recours humain réel, au sens de l'article 22 du RGPD. Réversibilité politique : aucun dispositif ne doit verrouiller à un degré tel qu'un changement démocratique de la règle deviendrait techniquement impraticable. Sans ces garde-fous, l'empêchement par le code n'est pas le prolongement de l'État de droit : il en est la sortie silencieuse !

    7 min
  2. #6.11 Intelligence Artificielle, comment redéfinit-elle le métier de directeur financier

    4 may

    #6.11 Intelligence Artificielle, comment redéfinit-elle le métier de directeur financier

    Intelligence artificielle : comment redéfinit-elle le métier de directeur financier Clôtures accélérées, prévisions en temps réel, détection de fraude, assistants conversationnels embarqués dans l'ERP : l'intelligence artificielle n'est plus un horizon lointain pour les directions financières. Selon Deloitte, 87 % des DAF estiment qu'elle sera « extrêmement ou très importante » pour leur fonction en 2026. Ce que l'IA apporte vraiment Il faut commencer par distinguer deux familles de technologies. L'IA dite « traditionnelle » repose sur l'apprentissage machine : elle apprend à partir de données historiques pour classer, prédire ou détecter des anomalies. L'IA générative, popularisée depuis 2022 grâce à ChatGPT, produit du texte, du code, des synthèses et alimente désormais des « agents » capables d'orchestrer des tâches. Les deux se combinent pour offrir quatre apports majeurs à l'entreprise. L'automatisation intelligente des tâches répétitives d'abord. Saisie et rapprochement de factures, lettrage comptable, contrôle de cohérence, extraction de données depuis des PDF ou des images : ce que l'automatisation des processus faisait déjà de façon rigide devient adaptatif, capable de gérer les exceptions. L'analyse prédictive ensuite, qui permet de modéliser l'évolution de la trésorerie, d'anticiper des impayés ou de simuler des scénarios budgétaires. La détection d'anomalies et la lutte contre la fraude, historiquement l'un des cas d'usage les plus matures dans la banque, étendue aujourd'hui aux dépenses internes et aux notes de frais. Et enfin l'assistance conversationnelle : copilotes intégrés aux ERP qui rédigent des synthèses, expliquent un écart ou génèrent un premier jet de commentaire de clôture. Quelle traduction concrète pour la fonction finance Pour le directeur financier, ces technologies se déclinent sur l'ensemble du cycle. En comptabilité fournisseurs, l'IA scanne, classe et pré-comptabilise les factures : les premiers retours d'expérience publiés par Deloitte font état d'une automatisation avancée au-delà du simple couple OCR/RPA. En clôture, les tableaux de bord s'actualisent en continu, les anomalies remontent automatiquement et le délai de clôture mensuelle peut être sensiblement raccourci, à condition, comme le rappellent les praticiens réunis aux Journées DAF 2026, d'avoir préalablement standardisé les processus. En planification financière, les modèles apprennent à partir des données historiques et externes pour produire des prévisions glissantes plus fiables que les traditionnels budgets annuels. En trésorerie, l'IA permet un pilotage quasi-temps réel de la position de trésorerie. En conformité enfin, elle automatise les contrôles KYC, la détection d'opérations suspectes et la préparation des déclarations fiscales, ce qui représente un atout considérable dans le contexte de généralisation de la Facture Normalisée Électronique. Un avertissement toutefois : selon Gartner, seuls 36 % des DAF se disent aujourd'hui confiants dans leur capacité à tirer un impact mesurable de l'IA, essentiellement à cause de l'absence ou de la faiblesse de la gouvernance des données. La supervision humaine reste la règle sur tous les processus critiques. Quelles tendances pour les prochaines années Trois mouvements vont structurer le paysage. Premièrement, la montée de l'IA agentique. Selon Gartner, les agents autonomes prendront en charge 15 % des décisions quotidiennes et alimenteront 33 % des applications d'entreprise à l'horizon 2028. Deloitte observe déjà que plus d'un DAF sur deux (54 %) fait de leur intégration une priorité de transformation pour 2026. Deuxièmement, la convergence IA-données-cloud. L'IA ne produit des résultats fiables que si elle s'appuie sur des données propres, structurées et accessibles. Cela pousse à accélérer la migration vers des ERP modernes et à formaliser une véritable gouvernance de la donnée. Troisièmement, une régulation qui se structure. Les DAF devront intégrer ces cadres nationaux, les lois régionales sur la protection des données et les exigences comme l'AI Act européen. Après la gouvernance des données, c'est la gouvernance de l'IA que les DAF devront superviser. Proposition d'un plan d'action en 5 points pour votre DAF 1.      Cartographier les cas d'usage à fort ROI. Lister les processus les plus consommateurs de temps (saisie de factures, rapprochements bancaires, relances clients, reporting de clôture, contrôles TVA) et sélectionner deux ou trois chantiers pilotes. L'objectif à six mois : prouver la valeur, sans chercher à couvrir tout le périmètre. Avancer par petits pas, très opérationnels. 2.      Fiabiliser les fondations avant d'automatiser. Un ERP à jour, des référentiels tiers propres et des API stables : sans cela, l'IA amplifiera les erreurs existantes ! 3.      Mettre en place une gouvernance IA et données. Définir qui peut déployer un modèle, sur quelles données, avec quel niveau de validation humaine. Documenter chaque usage, tracer les décisions automatisées et s'aligner sur la stratégie nationale du pays d'exploitation ainsi que sur la loi locale de protection des données personnelles. Se former et se faire accompagner sur le sujet est indispensable. 4.      Former l'équipe et recruter les profils hybrides. La réussite dépend moins de l'outil que de l'appropriation. Prévoir un parcours de formation pour les contrôleurs de gestion et comptables, recruter ou développer en interne des profils « data-finance ». 5.      Mesurer, sécuriser, itérer. Définir pour chaque pilote des KPI clairs (délai de clôture, taux d'automatisation des factures, écart de prévision, coût par transaction) et un cadre de cybersécurité adapté, car l'exposition d'un ERP connecté à un modèle d'IA crée de nouveaux risques. Réviser le dispositif tous les six mois pour passer progressivement du pilote à l'industrialisation. L'intelligence artificielle n'est ni une mode ni une menace pour le métier de DAF : c'est une extension de ses capacités. Les directions financières qui sauront articuler ces trois dynamiques (technologie, conformité, talents) ne se contenteront pas de gagner en productivité : elles s'imposeront comme co-pilotes stratégiques de la croissance de leur entreprise.

    8 min
  3. #6.9 Catalogue de données, LLM et MCP

    13 abr

    #6.9 Catalogue de données, LLM et MCP

    Le LLM va-t-il devenir l'interface unifiée de la gouvernance des données ? Récemment j'évoquais les raisons principales d'échec du déploiement de nombreux catalogues de données. En première ligne, l'absence d'adoption suffisante par les utilisateurs métiers. Doit-on refondre les interfaces utilisateurs ? Une nouvelle voie apparait : abandonner l'interface utilisateur ! Et la confier à un LLM qui interrogera, via un serveur MCP, la base de données du catalogue. L'habitude d'interroger un moteur de recherche pour obtenir une réponse a changé. Le réflexe, en particulier dans la dernière génération, est maintenant de poser toutes ses questions à une IA générative. Le phénomène ChatGPT est devenu une évidence quotidienne. Arrivés dans l'entreprise, les futurs juniors reproduiront ce comportement. Il sera difficile de leur imposer l'usage du moteur de recherche de l'intranet, ou d'apprendre l'interface utilisateur de dizaines d'applications. L'idée est donc de dissocier la base, contenant les métadonnées qui constituent le catalogue, et l'outil d'interrogation qui devient le LLM. Comment interroger le catalogue central via le LLM ? En choisissant un catalogue compatible avec le nouveau protocole MCP. Ce protocole MCP (Multi-Cloud Protocol) est un cadre technique conçu pour faciliter l'interopérabilité, la portabilité et la gouvernance des données entre différents environnements cloud (publics, privés, hybrides). Il vise à standardiser les échanges de données, les métadonnées et les politiques de sécurité. Il a été développé par Anthropic en 2024. Il s'agit d'un standard ouvert, développé en collaboration avec la communauté et hébergé par la fondation Linux, qui permet une intégration standardisée entre les applications d'IA et les sources de données ou outils externes. Plusieurs implémentations, SDK et serveurs MCP sont disponibles en open source sur des plateformes comme GitHub, encourageant ainsi l'interopérabilité et l'innovation collaborative. Alation, Atlan, DataHub, Datadog (liste non exhaustive) ont déjà annoncé une compatibilité MCP de leurs catalogues de données. Un pari risqué pour les éditeurs de catalogues de données Sur le papier, cette nouvelle architecture est séduisante, même pour les éditeurs de logiciels. L'éditeur n'a plus à se préoccuper de l'interface utilisateur métier. Il peut se concentrer sur sa cible privilégiée, le département informatique en charge de la mise en place. L'interface d'administration subsiste ; celle des usages est déléguée au LLM. Mais il y a un revers à la médaille, la disparition du catalogue de données dans les couches cachées accédées par le LLM. Le catalogue devient invisible ! C'est très bien me répondrez-vous ? Peut-être… sauf pour son éditeur. A la question : « quel est votre outil de catalogage de données ? » posée à un utilisateur métier, ce dernier répondra sans doute « Euh… je ne sais pas… c'est Copilot, Mistral, ChatGPT… ? ». Car pour lui, le catalogue aura disparu, noyé dans son LLM utilisé quotidiennement. Conséquences pour les éditeurs : une perte de valeur visible et une plus grande interchangeabilité. Car si mon catalogue est une simple base de données, sans interface utilisateur, accédée de manière standard via un serveur MCP, je peux facilement le remplacer par un autre ; et cela sans que l'utilisateur n'en ait conscience. Du point de vue de l'éditeur, le risque est grand de voir sa valeur perçue réduite à peau de chagrin. Autre question, celle de la responsabilité en cas de réponse erronée. L'utilisateur fera-t-il la part des choses entre les erreurs dans le catalogue, et celles générées par le LLM ? Si l'information de base est correcte dans le catalogue, mais que le LLM répond mal à la question posée par l'utilisateur… à qui la faute ? Et à qui la perception de la faute ? En conclusion La standardisation des catalogues de données, accédées par les LLM au travers de serveurs MCP semble donc une évidente amélioration. Pas le LLM standard que vous utilisez à titre personnel, mais un LLM sur mesure, personnalisé et entrainé pour votre organisation, comme va le proposer Mistral avec son offre Forge [1]. Le LLM deviendra peu à peu l'outil quotidien de chaque employé, qui l'utilisera pour poser toutes ses questions. Le LLM ira alors piocher, via des serveurs MCP, dans les différentes sources de données, catalogue, entrepôt de données, lac de données, applications métier. Le navigateur web était devenu depuis une vingtaine d'années l'interface standard des applications qui migraient vers le cloud. Le LLM sera sans doute la prochaine étape. Cette évolution ne se fera pas instantanément, ni sans conséquences, mais reparlons-en d'ici cinq ans, elle sera sans doute devenue une évidence. [1] https://www.usine-digitale.fr/intelligence-artificielle/mistral-ai/mistral-ai-lance-forge-un-service-de-creation-de-modele-dia-sur-mesure-pour-les-grandes-entreprises.NFBAALPLMNEO7ECP62HMAC35JY.html

    6 min
  4. #6.8 Un catalogue de données social et orienté utilisateurs

    7 abr

    #6.8 Un catalogue de données social et orienté utilisateurs

    Un catalogue social de données, orienté utilisateurs Il y a quelques mois, j'ai travaillé pour une grande entreprise sur la formalisation des caractéristiques du catalogue de données idéal. « Social et orienté vers ses utilisateurs » sont ressorties comme les caractéristiques essentielles d'un catalogue efficace en 2026… ou 2027. Un catalogue social, c'est-à-dire conçu comme tous les outils que nous utilisons au quotidien, qui favorisent l'interaction, la création de contenu par l'utilisateur, la simplicité d'utilisation, et l'intégration aux applications existantes. Mais surtout conçu pour ceux qui l'utiliseront et non pour ceux qui le mettront en service. Un catalogue entièrement pensé en faveur de l'expérience utilisateur. Social : au croisement de Google Maps, LinkedIn et Tinder Pensez à votre journée, aux interactions que vous menez avec l'information, à titre personnel. Et si vous n'y croyez pas, regardez ceux qui nous remplaceront dans quelques années, les fameux millénaux. Commander un Uber et lui donner une note, réserver un Airbnb pour le week-end et laisser un commentaire, sélectionner un restaurant sur Google Maps et lui attribuer des étoiles en publiant des photos, laisser un message à un collègue sur LinkedIn pour sa nomination, glisser vers la droite ou vers la gauche les profils qui apparaissent sur votre fil Tinder… et la litanie pourrait continuer longtemps. Notre vie numérique est devenue sociale. Cela a pris vingt ans, mais ces interactions sont maintenant au cœur de notre vie quotidienne. Et une fois arrivé au bureau, après avoir allumé votre PC, la consultation de votre catalogue de données ressemble à un vieux Minitel : une dizaine d'onglets, des dizaines de champs, et presque aucune interaction. Et vous vous demandez encore pourquoi vos utilisateurs ne l'adoptent pas ! Demain, votre catalogue de données, si vous souhaitez qu'il soit utilisé, devra : -              Permettre de noter chaque donnée et de consulter les notes attribuées par les autres utilisateurs ; des notes et de commentaires sur l'expérience des autres : qualité, conformité, fréquence de mise à jour, intérêt… -              Dialoguer avec le référent de chaque donnée, et avec ses autres utilisateurs, au travers d'un « chat » propre à chaque donnée. -              Signifier votre intérêt pour cette donnée par un simple « swipe » comme dans Tinder. Nous verrons si vous « matchez » avec le data owner ! Le catalogue de données de demain sera social ou… ne sera toujours pas utilisé par les métiers ! Éditeurs de logiciels, à vous de faire en sorte qu'il soit l'application que tout data worker ouvre chaque matin et garde toute la journée sur un coin de son bureau. Choisi pour ceux qui l'utilisent, pas pour ceux qui le construisent Récemment, une grande organisation me contait son processus de choix d'un catalogue de données centralisé. Processus piloté par la direction informatique (ce qui est compréhensible), mais qui semble oublier ou minimiser les perceptions de ses futurs utilisateurs. Un catalogue de données est en effet destiné à être utilisé ! Plus les utilisateurs métiers prendront l'habitude de le consulter pour y rechercher l'information dont ils ont besoin, plus le succès sera au rendez-vous. Même si le projet est mené par la direction informatique, ce n'est pas la satisfaction des utilisateurs-informaticiens qui en sera l'indicateur principal, mais celle des utilisateurs métiers. Dans mon exemple, la direction informatique compare plusieurs solutions et sa préférence va à un outil technique, un catalogue de données en open source, mais dont l'interface utilisateur est loin d'être intuitive pour des non-informaticiens. Les départements métier, également consultés, ont eu choisi un catalogue simple, efficace, à l'interface utilisateur beaucoup plus accessible. Qui va l'emporter ? Je crains de connaître le vainqueur par avance… ainsi que la suite de l'histoire lorsqu'une année après, on reprochera au catalogue, et au responsable de la gouvernance, de ne pas être entré dans les habitudes des utilisateurs métier. Mon conseil, comparez les solutions, établissez des impératifs techniques à respecter, mais in fine, laissez ceux qui l'utiliseront au quotidien établir leur préférence. L'équipe de mise en place passera quelques mois à l'installer et le paramétrer ? Des centaines d'utilisateurs passeront des années à le consulter ! Devinez qui devrait choisir l'interface utilisateur qui lui plait le plus… Deux critères clefs pour eux : -              Une interface de mise à jour simple : si vous souhaitez que l'utilisateur métier mette à jour les métadonnées dont il est le référent, il faut que cette mise à jour soit ludique ! -              Proposez une recherche en langage naturel comme « quelle donnée est disponible pour évaluer le chiffre d'affaires par client ? ». Vous voulez mettre de l'IA ? C'est ici qu'elle se justifie Ni centralisé, ni décentralisé, mais fédéré. Depuis longtemps, le catalogue des métadonnées est pensé centralisé. Est-ce la bonne méthode ? S'il est si compliqué d'en faire adopter l'usage par les utilisateurs métier, c'est peut-être qu'ils s'en sentent éloignés ; qu'ils le perçoivent comme un outil de plus géré par la direction, plutôt que comme un outil destiné à leur faciliter l'accès aux données. Par ailleurs, est-il logique que les métadonnées soient centralisées, alors que les données sont de plus en plus gérées dans les départements métier ? Les métadonnées ne devraient-elles pas rester au plus proche des données ? Mais alors, si les métadonnées sont décentralisées, comment s'assurer que les différents métiers les gèrent de manière cohérente, dans un objectif de partage à travers l'ensemble de l'organisation ? Pour cela il ne faut pas passer de la centralisation à la décentralisation, mais à la fédéralisation : des métadonnées décentralisées, mais qui respectent une gouvernance centralisée. Comme dans un État fédéral, certaines compétences sont déléguées aux métiers, d'autres relèvent de décisions centralisées (prises par exemple par le comité de gouvernance des données). Pour creuser cette idée de maille de métadonnées, lisez ce qu'a publié Ole Olesen-Bagneux sur le thème du Meta Grid : https://olesenbagneux.medium.com/the-meta-grid-is-the-third-wave-of-data-decentralization-b18827711cec et son livre Fundamentals of metadata management (https://www.actian.com/fr/lp/fundamentals-of-metadata-management-ebook/). Interopéré par des contrats de données Aimez-vous faire plusieurs fois la même chose ? Non, et c'est normal. Alors, pourquoi ne pas essayer de profiter d'un travail pour en réaliser plusieurs ? Vous réalisez des interfaces entre applications, entre utilisateurs de données. Ces interfaces incluent un schéma de données. Vous pourriez utiliser cette description d'interface pour alimenter partiellement, mais automatiquement votre catalogue de données. C'est toujours cela de pris, et cela avance le travail du référent données. Pour cela, vous devez formaliser vos contrats d'interface, en utilisant des contrats de données (data contracts), et vous avez de la chance. Jean-Georges Perrin et l'équipe de volontaires de Bitol (membre de la fondation Linux) ont travaillé pour vous. Ils ont conçu ODCS (Open Data Contract Standard) qui permet l'interopérabilité entre les outils qui y adhérent, grâce à un standard open source. En l'adoptant, vous disposerez de contrats de données qui pourront alimenter un ETL, mais aussi votre catalogue de métadonnées, ou encore l'outil d'observabilité du data steward. I had a dream… Alors non, malheureusement, ce catalogue social, compatible ODCS/OPDS, et fédéralisé des informations n'existe pas encore ! Mais ses bases sont claires. Visionnaire, certainement. Réaliste, pas encore ? Mais face aux nombreuses difficultés liées à l'implémentation des catalogues existants, il faut un « reset ». Je rêve d'un catalogue imaginé comme un produit Apple, que l'on soit fier de montrer, et non comme un produit Microsoft où il faut aller dans le menu Démarrer pour Éteindre… Pour que l'alchimie fonctionne, il faudrait que les utilisateurs manifestent de l'intérêt pour un catalogue conçu en fonction de leurs besoins ; que les informaticiens conçoivent qu'un catalogue de données est destiné à être utilisé et pas simplement construit ; et que les responsables de la gouvernance mettent en avant l'indicateur du taux d'usage et non de la complétude théorique. Quel éditeur est prêt à relever le défi ? Si vous voulez en savoir plus et expérimenter tout cela, participez aux formations sur la gouvernance des données que je donne tout au long de l'année.

    9 min
  5. #6.6 Les agriculteurs dépossédés de leurs données, avec Caroline Gans Combe

    23 mar

    #6.6 Les agriculteurs dépossédés de leurs données, avec Caroline Gans Combe

    Quelques semaines après la fermeture du Salon de l'Agriculture, une question centrale se pose : et si une partie de la réponse à la crise agricole se trouvait dans une ressource déjà produite par les exploitations, mais encore largement invisible ? Chaque jour, les fermes françaises génèrent des données sur les sols, l'eau, le climat, les cultures ou les rendements. Ces informations ont une valeur stratégique. Elles alimentent les outils d'aide à la décision, les modèles d'intelligence artificielle et les services développés par les acteurs de l'agritech. Pourtant, ceux qui produisent ces données en tirent encore très peu de bénéfices directs. Le marché de l'agriculture numérique, estimé à 23 milliards de dollars en 2025 et attendu à plus de 60 milliards d'ici 2034, est aujourd'hui largement structuré par les industriels et les plateformes. Les exploitants produisent la matière première, mais n'en maîtrisent ni l'usage ni la valeur. Cette situation freine l'adoption du numérique et pose une question structurante pour l'avenir du secteur : celle de la reconnaissance des données comme un véritable actif agricole. Au-delà de leur valeur économique, ces données permettent également de mesurer et de valoriser les services écologiques rendus par les exploitations, qui représentent jusqu'à 50% de la valeur économique des grandes cultures, et deviennent un élément déterminant pour les acteurs financiers. Experte des nouveaux paradigmes de l'innovation et de la création de valeur, nous recevons Caroline Gans Combe qui décrypte pourquoi la donnée pourrait devenir un levier économique structurant pour les agriculteurs, à condition de mettre en place des règles garantissant leur maîtrise et leur valorisation.

    20 min

Información

Decideo est la communauté d'information et d'échange autour des outils et meilleures pratiques d'analyse de données (Machine Learning, Business Intelligence, Big Data, Science des Données, Entrepôts de données…). Véritable réseau social des professionnels de la donnée, Decideo est disponible en français www.decideo.fr et en espagnol www.decideo.com. Opinions d'experts, actualités, agenda, offres d'emploi, sont disponibles en ligne et sur les applications mobiles gratuites. Decideo is the leading user community of Business Intelligence, Data Science, Big Data and Analytics professionals. Decideo is a real social network of data driven economy, available in French www.decideo.fr, and Spanish www.decideo.com. User stories, best practices, news, software reviews, agenda, job board… are available online, and through podcast and mobile applications.