11月1日
1 小時 19 分鐘

#174 Zita Marinho - Como funcionam os algoritmos do ChatGPT e de outros Large Language Models?

Zita Marinho é investigadora na Google DeepMind, onde atualmente trabalha em Reinforcement Learning (“aprendizagem por reforço”, uma área de Machine Learning). Possui um duplo doutoramento em Robótica pelo Instituto de Robótica da Carnegie Mellon University e do Instituto Superior Tecnico em 2018. Os seus interesses de investigação estão na interseção entre algoritmos de aprendizagem automática e Processamento de Linguagem Natural.

-> Apoie este podcast e faça parte da comunidade de mecenas do 45 Graus em: 45grauspodcast.com

-> Workshops de Pensamento Crítico.

_______________

Índice:

(0:00) Introdução

(6:40) Algoritmos de redes neuronais | Nobel da Física 2024 | Importância de ter várias camadas | Vanishing and exploding gradients

(20:27) Como aprendem os modelos? Gradient descent e backpropagation | Redes recorrentes | Nobel e os modelos de Ising

(28:24) A revolução dos Transformers, tipo ChatGPT. Paper Attention is All You Need

(36:55) O que fez o ChatGPT de inovador? | Comparação com o cérebro humano | ChatGPT va outros modelos LLM actuais (e.g. Gemini, Claude)

(44:58) Dicas de prompting

(50:16) Forcas e fraquezas dos modelos actuais. | Propriedades emergentes misteriosas Relatório da BCG | Riscos de alucinação

(1:11:13) Artigo “The bitter lesson”, de Rich Sutton | Deep Blue

Livros recomendados: The Learning Brain, Thad A. Polk, A Brief History of Mathematical Thought, de Luke Heaton, A Brief History of Intelligence, de Max Bennett, Language Models: A Guide for the Perplexed

_______________

Esta conversa foi editada por: Hugo Oliveira

單集網頁

節目

45 Graus
頻率

每兩星期更新
發佈日期

2024年11月1日上午5:30 [UTC]
長度

1 小時 19 分鐘
分級

兒童適宜

#174 Zita Marinho - Como funcionam os algoritmos do ChatGPT e de outros Large Language Models?

資料