Big Data e Inteligencia Artificial

Marta Arroyo

Un podcast para personas aparentemente normales que quieren transformarse en ninjas del Big Data, de la Inteligencia Artificial y de la vida

  1. OCT 29

    105. Cómo LinkedIn actualiza sus modelos de IA cada hora (y por qué importa)

    🥷 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Apúntate aquí a la membresía ninja⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🥷 Accede a todo el contenido para convertirte en un ninja de los datos: ⚡️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Podcast premium⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🛠️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Tutoriales⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 📚 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Resúmenes de libros top⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🎥 ⁠⁠Sesiones de formación⁠⁠ 👥 Comunidad ninja En el episodio de hoy descubrimos cómo LinkedIn actualiza sus modelos de IA cada hora sin morir en el intento. Spoiler: entrenar un modelo una vez está bien... pero mantenerlo actualizado 24/7 con millones de usuarios es el verdadero reto. ✅ Por qué el entrenamiento tradicional "cold start" no funciona a escala (es caro, lento y frágil). ✅ Qué es el entrenamiento incremental y cómo LinkedIn ahorra 9 veces en costes. ✅ El desafío de generar datos en tiempo real con Apache Flink y Kafka. ✅ Cómo manejar 30,000-35,000 eventos por segundo con menos de 5ms de latencia. ✅ Por qué los grafos estáticos de TensorFlow/PyTorch son clave en producción. ✅ La importancia de los checkpoints y la tolerancia a fallos. ✅ Resultados reales: +2% en aplicaciones cualificadas, +4% en clicks de anuncios... Y mucho más💥 Después de este episodio entenderás por qué llevar Machine Learning a producción es MUY diferente a entrenar en un notebook de Jupyter. 📰 Suscríbete a la newsletter donde profundizaré en las herramientas concretas que usa LinkedIn: https://datos.kit.com/roadmap Episodios anteriores relacionados: ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 94⁠.⁠ Buenas prácticas para científicos de datos ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 80⁠.⁠ Machine Learning 101 ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 83⁠.⁠ Una neurona Recuerda que si tienes cualquier duda, pregunta o comentario puedes contactar conmigo a través del ⁠⁠⁠⁠formulario de contacto⁠⁠⁠⁠ o en ⁠⁠⁠Linkedin⁠⁠. 📝 Podéis encontrar las⁠ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠notas del programa⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ⁠⁠⁠ completas en ⁠https://datos.ninja/podcast/105-linkedin-y-el-entrenamiento-incremental-ml

    22 min
  2. OCT 8

    104. ¿Qué significa REALMENTE data-driven?

    En el episodio de hoy desciframos qué significa REALMENTE ser data-driven y por qué el 76% de las empresas fracasa en el intento. Descubre cómo diseñar una estrategia de datos que funcione de verdad, no solo que quede bonita en un PowerPoint. ✅ El gran error: pensar que ser data-driven es un proyecto tecnológico (spoiler: es una transformación cultural). ✅ Por qué tener un data warehouse y dashboards no te hace data-driven. ✅ La relación real entre estrategia de negocio y estrategia de datos: primero defines cómo ganar, luego qué capacidades de datos necesitas. ✅ Los 3 pilares fundamentales: cultura organizacional, democratización del dato y alineación con el negocio. ✅ Ejemplos concretos: de la empresa de seguros que ignora sus modelos predictivos al retail de moda que detecta microtendencias. ✅ Cómo medir el éxito con métricas de negocio reales, no técnicas. Y mucho más💥 🎯 Evento SAP - 30 de octubre en Barcelona SAP presenta su nueva visión para la gestión empresarial que combina IA, datos y aplicaciones para liberar todo el potencial de un negocio verdaderamente data-driven. 📍 Llotja de Mar, Barcelona 📅 30 de octubre 2025 Descubre cómo conectar toda la cadena de valor empresarial con capacidades de IA incorporadas y datos contextualizados. Disfruta de paneles con expertos, casos de éxito de clientes, demos en directo y networking del bueno en un lugar incomparable 🤩. 👉 Toda la información y registro: https://go4.events.sap.com/es-sap-business-suite-innovation-day-barcelona/es_es/registration.html?source=marta-arroyo 📝 Podéis encontrar las⁠ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠notas del programa⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ⁠⁠⁠ completas en ⁠⁠https://datos.ninja/podcast/104-que-significa-realmente-data-driven/

    19 min
  3. SEP 26

    103. ¿Qué hace un analista de datos?

    🥷 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Apúntate aquí a la membresía ninja⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🥷 Accede a todo el contenido para convertirte en un ninja de los datos: ⚡️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Podcast premium⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🛠️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Tutoriales⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 📚 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Resúmenes de libros top⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🎥 ⁠Sesiones de formación⁠ 👥 Comunidad ninja En el episodio de hoy desvelamos la figura clave en cualquier equipo de datos: el Analista de Datos. Descubre qué hace, qué habilidades necesita y por qué es una de las profesiones con más futuro. ✅ Quién es el Analista de Datos: el detective de la empresa. ✅ Las 5 tareas principales de su día a día: de la pregunta de negocio al dashboard. ✅ Habilidades técnicas (SQL, Power BI, Python...) y blandas (curiosidad, comunicación). ✅ Las herramientas que no pueden faltar en su mochila. ✅ Diferencias clave con el Científico de Datos y el Analista de Negocio. ✅ Por qué es el primer rol de datos que contrata una empresa... Y mucho más💥 Después de conocer a fondo el rol del Analista de Datos, ¿te preguntas si es el camino para ti? Descubre qué rol de datos encaja mejor contigo: 👉 Haz el test aquí: ⁠https://datos.kit.com/roadmap⁠ Episodios anteriores relacionados: ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 6⁠. Tres tipos de análisis de datos y Youtube ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 24⁠. ¿Qué hacen los ingenieros de datos? ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 39⁠. Todos somos analistas de datos ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 77. La importancia del Data Storytelling Recuerda que si tienes cualquier duda, pregunta o comentario puedes contactar conmigo a través del ⁠⁠⁠formulario de contacto⁠⁠⁠ o en ⁠⁠Linkedin⁠. 📝 Podéis encontrar las⁠ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠notas del programa⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ⁠⁠⁠ completas en https://datos.ninja/podcast/103-que-hace-un-analista-de-datos/

    20 min
  4. SEP 10

    102. Los datos no valen nada sin ESTO

    🥷 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Apúntate aquí a la membresía ninja⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🥷 Accede a todo el contenido para convertirte en un ninja de los datos: ⚡️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Podcast premium⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🛠️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Tutoriales⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 📚 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Resúmenes de libros top⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🎥 Sesiones de formación 👥 Comunidad ninja En el episodio de hoy descubrimos todo lo que hay detrás de la Inteligencia Artificial que no se ve: el Modern Data Stack. La infraestructura que hace posible que ChatGPT, los dashboards de tu empresa y cualquier solución basada en datos funcione. ✅ Qué es el Modern Data Stack y por qué tiene que importarte ✅ Las fases clave: desde la ingesta hasta la gobernanza ✅ La evolución desde Hadoop hasta las herramientas en la nube ✅ ETL vs ELT: cuándo usar cada enfoque ✅ Herramientas específicas para cada fase (Snowflake, dbt, Fivetran...) ✅ Por qué los datos por sí solos no valen nada...Y mucho más💥 Después de conocer todo el ecosistema del Modern Data Stack, ¿te preguntas por dónde empezar? Descubre qué rol de datos encaja mejor contigo: 👉 Haz el test aquí: https://datos.kit.com/roadmap Episodios anteriores relacionados: ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 24: ¿Qué hacen los ingenieros de datos? ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 31: Regreso al futuro: el ecosistema Hadoop ⭕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Episodio 54: El lago de los datos Recuerda que si tienes cualquier duda, pregunta o comentario puedes contactar conmigo a través del ⁠⁠formulario de contacto⁠⁠ o en ⁠Linkedin. 📝 Podéis encontrar las⁠ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠notas del programa⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ⁠⁠⁠ completas en ⁠https://datos.ninja/podcast/102-modern-data-stack/

    20 min
  5. 12/11/2024

    99. Grandes éxitos de la Inteligencia Artificial - Industria y política [Edición 2024]

    🥷 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Apúntate aquí a la membresía ninja⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🥷 Accede a todo el contenido para convertirte en un ninja de los datos: ⚡️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Podcast premium⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🛠️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Tutoriales⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 📚 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Resúmenes de libros top⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 👥 Comunidad ninja En el episodio de hoy seguimos desgranando el estado de la IA en 2024, con un enfoque en la industria, la política y las regulaciones. ¿Listos para más sorpresas? 🚀 NVIDIA reina suprema: GPUs Blackwell, récord de mercado y su dominio inquebrantable... aunque Google, Meta y OpenAI empiezan aintentar desengancharse. 🚀 La batalla de China y EE.UU.: Restricciones de exportación, chips diseñados a medida y laboratorios chinos que siguen innovando contra viento y marea. 🚀 Regulación global: Europa, EE.UU. y China toman caminos muy distintos para regular la IA, con impactos directos en empresas y usuarios. 🚀 El impacto ambiental: Centros de datos voraces en energía, proyectos colosales y una sostenibilidad que deja mucho que desear. Un viaje por los retos y las oportunidades que están definiendo el futuro de la IA. ¡No te lo pierdas! ¡Dale al play! Recuerda que si tienes cualquier duda, pregunta o comentario puedes contactar conmigo a través del ⁠⁠⁠formulario de contacto⁠⁠⁠ o en ⁠⁠⁠Twitter⁠⁠⁠. ☕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠¡Apoya el podcast!⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ☕️

    27 min
  6. 12/04/2024

    98. Grandes éxitos de la Inteligencia Artificial [Edición 2024]

    🥷 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Apúntate aquí a la membresía ninja⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🥷 Accede a todo el contenido para convertirte en un ninja de los datos: ⚡️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Podcast premium⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 🛠️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Tutoriales⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 📚 ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠Resúmenes de libros top⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ 👥 Comunidad ninja En el episodio de hoy repasamos el estado de la Inteligencia Artificial en 2024 basándonos en el informe de Air Street Capital. 🚀 La competencia entre los grandes modelos de lenguaje: Claude 3.5 Sonnet, Gemini 1.5, Grok 2 y el innovador o1 de OpenAI. 🚀 Modelos más pequeños que caben en tu móvil, eficientes gracias a la destilación y la cuantización. 🚀 Avances impresionantes en biología y química con AlphaFold 3 y AlphaProteo, ¡hasta un Nobel por aquí! 🚀 La robótica vuelve al juego con sistemas como AutoRT y las plataformas que están acercando la tecnología a todos. 🚀 Y no nos olvidemos del Deep Learning para modelar el cerebro humano. ¡Dale al play y entérate de todo! Recuerda que si tienes cualquier duda, pregunta o comentario puedes contactar conmigo a través del ⁠⁠formulario de contacto⁠⁠ o en ⁠⁠Twitter⁠⁠. ☕️ ⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠¡Apoya el podcast!⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠ ☕️

    28 min

About

Un podcast para personas aparentemente normales que quieren transformarse en ninjas del Big Data, de la Inteligencia Artificial y de la vida

You Might Also Like