15 мин.

#80- Layer pruning e Mixture of Depths‪.‬ Vida com IA

    • Технологии

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.



Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.



Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.



Paper MoD: https://arxiv.org/pdf/2404.02258.pdf

Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf

Instagram do podcast: https://www.instagram.com/podcast.lifewithai

Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.



Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.



Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.



Paper MoD: https://arxiv.org/pdf/2404.02258.pdf

Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf

Instagram do podcast: https://www.instagram.com/podcast.lifewithai

Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

15 мин.

Топ подкастов в категории «Технологии»

Запуск завтра
libo/libo
Радио-Т
Umputun, Bobuk, Gray, Ksenks, Alek.sys
Podlodka Podcast
Егор Толстой, Стас Цыганов, Екатерина Петрова и Евгений Кателла
Lex Fridman Podcast
Lex Fridman
#BeardyCast: гаджеты и медиакультура
BeardyCast.com
Веб-стандарты
Сообщество «Веб-стандарты»