
10 épisodes

Data Driven 101 Marc Sanselme
-
- Technologies
-
-
5,0 • 16 notes
-
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
Sur Data Driven 101, on s’intéresse aux applications pratiques de la data dans toute leur diversité avec un objectif : démystifier ce concept.
Marc Sanselme dirige Scopeo, agence de R&D en Data Science et Machine Learning.
Dans ce podcast, il reçoit des professionnels de fonctions et d’horizons variés pour nous parler de leurs aventures, leurs succès, leurs échecs, leurs espoirs, leurs techniques, leurs astuces, leurs histoires et leurs convictions.
Réalisation et montage : Clémence Reliat
-
Épisode 9 : Alexis Frentz - Investir dans la data
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
Comment un Venture Capitalist choisit-il ses investissements ?
Alexis Frentz, investment manager du fond de venture capital Elaia, est l’invité dans l’épisode 9 de Data Driven 101.
Il nous partage à la fois les usages internes de la data chez Elaia mais aussi ce qui motive leurs choix d’investissements dans les startups du domaine.
Vous en apprendrez notamment :
👉🏼 Les critères d'investissement
👉🏼 Les bons et mauvais signaux
👉🏼 Comment se passe une due diligence côté data
Mot clés
Fond d'investissement: Un fonds d'investissement est une structure de placement collectif qui permet aux investisseurs de se regrouper pour investir dans des actifs financiers diversifiés.
Deep tech: La deep tech est un terme utilisé pour décrire les technologies avancées ou innovantes qui utilisent des concepts scientifiques et technologiques uniques, tels que l'intelligence artificielle, l'informatique quantique et la biotechnologie.
Simulation de Monte-Carlo: Une simulation de Monte-Carlo est une méthode statistique utilisée pour modéliser et analyser des systèmes complexes et prévoir leur comportement.
Bootstrapper: démarrer et développer une entreprise en utilisant un minimum de ressources, souvent en s'autofinançant et en faisant preuve de créativité.
Due diligence: La due diligence est le processus d'analyse minutieuse d'un investissement ou d'une collaboration potentielle pour évaluer les risques et les avantages potentiels.
Workflow: séquence des tâches et de processus
RGPD : Le Règlement Général sur la Protection des Données (RGPD) est un règlement de l'Union européenne en matière de protection des données et de vie privée pour toutes les personnes physiques à l'intérieur de l'Union européenne.
Scrapper : extraire des données à partir de sites web ou d'autres sources en ligne.
Travail de curation : Le travail de curation désigne le processus de sélection, d'organisation et de présentation de l'information ou du contenu, comme les contenus numériques, les patrimoines culturels et les données scientifiques. -
Épisode 8 : Arnaud Delaunay - Un robot agriculteur
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
L’intelligence artificielle peut-elle résoudre les problèmes environnementaux et sanitaires de l’agriculture ?
Farmwise propose un désherbage mécanique entièrement automatisé grâce à un tracteur-robot intelligent.
👉 Arnaud Delaunay, head of Computer Vision chez Farmwise, nous dévoile les dessous d’un projet d’ultra pointe technologique.
Il est l'invité de Marc Sanselme dans l’épisode 8 de Data Driven 101.
Définitions / références
MLOps : Gestion de la maintenance, du déploiement et de l’utilisation en production des modèles de Machine Learning
SDK : Software Development Kit): Un ensemble d'outils logiciels, de bibliothèques et de documentation qui permettent aux développeurs de créer des applications sur un framework donné
API (Application Programming Interface): Une interface de programmation qui permet à des applications de communiquer entre elles
Développeur backend : Développeur qui travaillent sur la partie du serveur d'une application.
Deep learning :Il s'agit d'une branche de l'apprentissage automatique qui utilise des réseaux de neurones multi-couches pour apprendre à partir de données. Il est utilisé pour des tâches telles que la reconnaissance d'images, la reconnaissance de la parole, la traduction automatique ou la génération de texte. -
Épisode 7 : Nicolas Marchais - Orienter l'effort de vente
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
L'effort commercial d'une entrepise doit être piloté. C'est pourquoi un "head of sales" est aujourd'hui avant tout un professionnel de la data.
👉 Comment trancher entre l’intuition et l’analyse quantitative pour prendre des décisions ?
👉 Comment “diviser pour régner” dans la data ?
👉 Comment faire évoluer les usages de la data avec l’hypercroissance de l’entreprise ?
Nicolas Marchais, ancien Head of Sales et employé numéro 1 de Spendesk, est l’invité de Marc Sanselme dans l’épisode 7 de Data Driven 101. Il nous parle des stratégies pour mieux consommer les données, orienter l’effort de vente et piloter la croissance dans une entreprise.
Définitions / références
Pipeline de vente : Processus méthodique de suivi des clients potentiels dans le cycle de vente.
A/B testing: L'A/B testing, est une méthode qui permet de comparer l'efficacité de 2 options en testant les deux options sur une population regroupées aléatoirement en deux cohortes et comparant les résultats obtenus sur chaque cohorte.
Alphas user : Premiers utilisateurs d’un logiciel, faisant partie de l’équipe qui le construit.
KPI : Key Performance Indicator, ensemble des indicateurs qui permettent de mesurer les performances
Query : Requête faite sur une base de données pour obtenir un extrait de ces données.
data warehouse : Infrastructure de stockage des données sous forme structurées
User Flow : parcours des utilisateurs
ROI : retour sur investissement
Insight : perception -
Épisode 6 : Charles Sutton - La pédagogie de la data
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
Ils ont voulu développer une petite plateforme de test pour le recrutement en Data Science et ils ont fini par créer un énorme organisme de formation continue en data.
👉 Quelle place pour les autodidactes dans le monde de la Data ?
👉 Comment s’adapter efficacement aux profils très différents qui souhaitent se former ?
👉 Comment rester au courant des pratiques d’entreprise dans ce monde en constante évolution ?
Charles Sutton, CTO de DataScientest, est l’invité de Marc Sanselme dans l’épisode 6 de Data Driven 101.
Il nous partage le recul que lui offre sa position d’entrepreneur qui a vu passer plus de 7000 apprenants.
Définitions / références
Skill assessment : Évaluation de compétence (recrutement)
Python : langage de programmation
Coursera : plate-forme de cours en ligne
IT : technologie de l’information (ordinateurs, stockage, réseaux…)
B to B : business to business, commerce d’entreprise à entreprise
Boot camp : programme intensif
MOOC (Massive Open Online Course) : Cours en ligne via une plateforme
Notebook : interface de programmation très utilisée en Data Science
Computer Vision : Branche de l’algorithmique qui concerne le traitement des images et de leur signification
NLP (Natural Language Processing) : Branche de l’algorithmique qui concerne le traitement du texte et de sa signification
Flagship : Produit phare
Deep learning (réseaux de neurones profonds) : Type d’algorithme de Machine Learning
MLOps : Gestion de la maintenance, du déploiement et de l’utilisation en production des modèles de Machine Learning
ML engineering (Machine Learning Engineering) : Ingéniérie autour du Machine Learning
PhD : doctorat
BI (Business Intelligence) : Analyse de donnée destinée à une meilleure compréhension du business
Doers : « faiseurs » , ce qui font
Software: logiciel
PoC : Proof of Concept, Démonstration de faisabilité
Data Warehouse : Infrastructure de stockage des données sous forme structurées
Data Lake : Infrastructure de stockage des données sous forme non-structurées
BU : BUSINESS UNIT, sous partie d’une organisation dédiée à un marché spécifique
Power BI (Microsoft) : Logiciel de Business Intelligence
DBT : Logiciel de Data Engineering -
Hors Série n°1 : Nikolaj Groeneweg - Générer des images grâce à l'IA
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
Loin des applications les plus courantes, il y a la ligne de front technologique. Dans ce numéro hors série à vocation pédagogique, nous cherchons à démystifier un des domaines technologiques ou l'IA a le plus progressé récemment : la génération d'image.
Dans cet épisode, Marc Sanselme reçoit Nikolaj Groeneweg pour un tour d'horizon de la génération d'image grâce à l'intelligence artificielle.
👉 Il nous dévoile les ficelles de la génération d'image et nous apprend avec beaucoup de pédagogie comment démarrer sur ce sujet.
👉 Vous y apprendrez comment écrire vos "prompts", c'est à dire murmurer à l'oreille des Intelligences Artificielles.
Références :
DALL-E : https://openai.com/dall-e-2/
Stable Diffusion : https://stability.ai/blog/stable-diffusion-public-release
LAION5B : https://laion.ai/blog/laion-5b/
La chaise avocat : https://www.technologyreview.com/2021/01/05/1015754/avocado-armchair-future-ai-openai-deep-learning-nlp-gpt3-computer-vision-common-sense/
DreamBooth :https://dreambooth.github.io/
ChatGPT : https://chat.openai.com/
Exemple de prompt très long : https://prompthero.com/prompt/f8383320123
Applications de retouche d'image :
https://clipdrop.co/
https://www.photoroom.com/
Labs Open AI : https://labs.openai.com/
Hugging Face : https://huggingface.co/spaces/stabilityai/stable-diffusion
Mid Journey : https://midjourney.com/home/?callbackUrl=%2Fapp%2F
Prompt Hero : https://prompthero.com/ -
Épisode 5 : Laure Lapostolle - Bien choisir ses indicateurs
Aidez-nous à vous proposer un contenu encore plus qualitatif en répondant à ce sondage :
https://rwpvajqq8vo.typeform.com/to/JPPpmYjz
Cela ne vous prendra que 3 minutes et nous aidera à vous proposer le contenu dont vous rêvez !
Merci d'avance :)
----------
👉 Comment doit-on faire évoluer ses indicateurs avec sa croissance et quels sont les pièges à éviter ?
👉 Qu'est-ce que le Machine Learning peut faire pour aider la planification ?
👉 Qu'est-ce que le RGPD peut avoir de positif pour une entreprise ?
Laure Lapostolle, DG adjointe de Quitoque, vient répondre aux questions de Marc Sanselme et nous dévoile les usages surprenants de la data dans une entreprise de livraison de repas en kit.
Dans cet épisode de Data Driven 101, Laure nous offre un tableau complet des applications efficaces de la Data Science et du Machine Learning mises en œuvre par ses équipes.
Avis
Super format
Un podcast pertinent avec des invités de qualité, très agréable à écouter, tout en étant très instructif du point de vue technique
Canon !
L’écouter c’est l’adopter !
Super podcast
Merci pour ce podcast !! Inviter le boss de greengo : meilleure idée du moment 😉