수도리부트

١٦‏/١١‏/٢٠٢٤
م ١، ح ٢
٤٣ من الدقائق

LLM을 더 빠르게 서빙하는 법, KV 캐싱 & Speculative Decoding

수도리부트

LLM을 더 빠르게 서빙하는 법

- KV 캐싱

- Paged Attention

- vLLM

- Speculative Decoding

- OpenAI 프롬프트 캐싱

- OpenAI Predicted Outputs

Physical intelligence,

- AI 로봇

- Action 모델

صفحة الويب الخاصة بالحلقة

البرنامج

수도리부트
معدل البث

يتم التحديث كل أسبوعين
تاريخ النشر

١٦ نوفمبر ٢٠٢٤ في ٩:٤٠ ص UTC
مدة الحلقة

٤٣ من الدقائق
الموسم

١
الحلقة

٢
التقييم

ملائم