15 min

#80- Layer pruning e Mixture of Depths‪.‬ Vida com IA

    • Technology

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.



Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.



Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.



Paper MoD: https://arxiv.org/pdf/2404.02258.pdf

Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf

Instagram do podcast: https://www.instagram.com/podcast.lifewithai

Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

Fala galera, continuando a serie de episódios sobre PEFT, nesse episoódio eu falo sobre tecnicas de otimização de inferência em LLMs.



Eu falo de layer pruning, onde a gente corta algumas camadas consecutivas da rede sem perder quase nada de qualidade do modelo.



Eu falo também sobre Mixture of Depths, uma tecnica semelhante ao Mixture of Experts, onde a gente usa um routing pra escolher quais tokens vão ser processados em qual camada da rede.



Paper MoD: https://arxiv.org/pdf/2404.02258.pdf

Paper layer pruning: https://arxiv.org/pdf/2403.17887v1.pdf

Instagram do podcast: https://www.instagram.com/podcast.lifewithai

Linkedin do podcast: https://www.linkedin.com/company/life-with-ai

15 min

Top Podcasts In Technology

Technologický podcast SHARE | Živé.sk | HernáZóna.sk
Ringier Slovakia Media s.r.o.
Hard Fork
The New York Times
Klik
SME.sk
Lex Fridman Podcast
Lex Fridman
Computerworld CZ
Internet Info
Appliště VideoCasty
Magazín Appliště.cz