수도리부트

2024/11/16
第 1 季第 2 集
43 分鐘

LLM을 더 빠르게 서빙하는 법, KV 캐싱 & Speculative Decoding

수도리부트

LLM을 더 빠르게 서빙하는 법

- KV 캐싱

- Paged Attention

- vLLM

- Speculative Decoding

- OpenAI 프롬프트 캐싱

- OpenAI Predicted Outputs

Physical intelligence,

- AI 로봇

- Action 모델

節目

수도리부트
頻率

隔週更新
發佈時間

2024年11月16日上午9:40 [UTC]
長度

43 分鐘
季數

1
集數

2
年齡分級

兒少適宜