수도리부트

2024/11/16
第 1 季，第 2 集
43 分钟

LLM을 더 빠르게 서빙하는 법, KV 캐싱 & Speculative Decoding

수도리부트

LLM을 더 빠르게 서빙하는 법

- KV 캐싱

- Paged Attention

- vLLM

- Speculative Decoding

- OpenAI 프롬프트 캐싱

- OpenAI Predicted Outputs

Physical intelligence,

- AI 로봇

- Action 모델

节目

수도리부트
频率

两周一更
发布时间

2024年11月16日 UTC 09:40
长度

43 分钟
季

1
单集

2
分级

儿童适宜