1 hr 17 min

#32 - Google Astra Vs GPT4o / Interview de Thomas, Ingénieur en Computer Vision Tsunam-IA: surfez sur la vague du changement apporté par l'intelligence artificielle

    • Technology

OpenAI a dévoilé GPT-4O, la nouvelle version de Chat GPT avec des capacités multimodales impressionnantes, tandis que Google a annoncé Gemini 1.5 pro, son propre modèle puissant désormais disponible en Europe. 
Notre invité, Thomas, expert en vision par ordinateur, nous partage ses expériences et ses réflexions sur l'évolution rapide du domaine, les dangers potentiels de l'IA et les opportunités qu'elle représente. De la reconstruction 3D à la détection de faux visuels, nous décryptons les enjeux d'une technologie qui ne cesse de se transformer.
https://aitestkitchen.withgoogle.com/ génération d'images et de musique.
https://aistudio.google.com/ accès à Gemini 1.5 Pro.
https://openai.com/index/hello-gpt-4o/ les capacités multimodales de GPT-4O.

01:34 - GPT-4O d'OpenAI : un modèle multi-modal puissant et rapide.05:32 - Impact de GPT-4O, Google Gemini 1.5 pro en Europe, éthique de l'IA.06:55 - Gemini accessible sans VPN, Project Astra, modèle vidéo09:58 - "Gems" de Google.12:59 - Claude 3 : disponibilité en Europe.14:08 - Présentation d'AI Test Kitchen.15:36 - Interview de Thomas : vision par ordinateur, réseaux de neurones, évolution de l'IA.18:33 - Apprentissage automatique, métadonnées, data poisoning.20:56 - Réseaux de neurones, complexité et défis, biais, qualité des données.24:08 - Le travail de Thomas sur la reconstruction 3D.28:00 - Création d'un algorithme de vision par ordinateur, défis liés à la précision et aux faux positifs.34:00 - Défis liés aux métadonnées, deepfakes, la responsabilité civile et la conduite autonome.42:00 - Conduite autonome, IA open-source, "fine tuning" des modèles, l'aspect "boîte noire".54:00 - Outils de vérification de l'authenticité, deepfakes et politique, le projet C2PA.58:00 - L'impact de GPT-4O, capacités multimodales, dangers potentiels.62:00 - Accès aux données, monopoles, IA ouverte.66:00 - Enjeux économiques de l'IA, adoption par les entreprises.70:00 - L'avenir de l'IA, les dangers potentiels.74:00 - L'IA dans le marketing, les deepfakes, la vision de l'IA, risques liés à sa démocratisation.

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

OpenAI a dévoilé GPT-4O, la nouvelle version de Chat GPT avec des capacités multimodales impressionnantes, tandis que Google a annoncé Gemini 1.5 pro, son propre modèle puissant désormais disponible en Europe. 
Notre invité, Thomas, expert en vision par ordinateur, nous partage ses expériences et ses réflexions sur l'évolution rapide du domaine, les dangers potentiels de l'IA et les opportunités qu'elle représente. De la reconstruction 3D à la détection de faux visuels, nous décryptons les enjeux d'une technologie qui ne cesse de se transformer.
https://aitestkitchen.withgoogle.com/ génération d'images et de musique.
https://aistudio.google.com/ accès à Gemini 1.5 Pro.
https://openai.com/index/hello-gpt-4o/ les capacités multimodales de GPT-4O.

01:34 - GPT-4O d'OpenAI : un modèle multi-modal puissant et rapide.05:32 - Impact de GPT-4O, Google Gemini 1.5 pro en Europe, éthique de l'IA.06:55 - Gemini accessible sans VPN, Project Astra, modèle vidéo09:58 - "Gems" de Google.12:59 - Claude 3 : disponibilité en Europe.14:08 - Présentation d'AI Test Kitchen.15:36 - Interview de Thomas : vision par ordinateur, réseaux de neurones, évolution de l'IA.18:33 - Apprentissage automatique, métadonnées, data poisoning.20:56 - Réseaux de neurones, complexité et défis, biais, qualité des données.24:08 - Le travail de Thomas sur la reconstruction 3D.28:00 - Création d'un algorithme de vision par ordinateur, défis liés à la précision et aux faux positifs.34:00 - Défis liés aux métadonnées, deepfakes, la responsabilité civile et la conduite autonome.42:00 - Conduite autonome, IA open-source, "fine tuning" des modèles, l'aspect "boîte noire".54:00 - Outils de vérification de l'authenticité, deepfakes et politique, le projet C2PA.58:00 - L'impact de GPT-4O, capacités multimodales, dangers potentiels.62:00 - Accès aux données, monopoles, IA ouverte.66:00 - Enjeux économiques de l'IA, adoption par les entreprises.70:00 - L'avenir de l'IA, les dangers potentiels.74:00 - L'IA dans le marketing, les deepfakes, la vision de l'IA, risques liés à sa démocratisation.

Hébergé par Acast. Visitez acast.com/privacy pour plus d'informations.

1 hr 17 min

Top Podcasts In Technology

Security Now (Video)
TWiT
Practical AI
Practical AI
Hard Fork
The New York Times
Deep Questions with Cal Newport
Cal Newport
Search Engine
PJ Vogt, Audacy, Jigsaw
Darknet Diaries
Jack Rhysider