51CTO-崔浩-LLM 推理优化与部署实战**

51CTO-崔浩-LLM 推理优化与部署实战**

KODABOX Lv8

封面
封面

资源简介

课程内容深入且结构化,分为三大核心模块:理论基石(LLM推理阶段、KVCache原理、性能指标TTFT/TPS等)、优化策略(模型量化AWQ/GPTQ、剪枝蒸馏、MQA/GQA注意力机制、FlashAttention、PagedAttention、持续批处理)以及部署实战(vLLM分布式推理集群搭建、TensorRT-LLM量化与评测、LLMCompressor工具链应用)。课程最大特点是理论与实践深度结合,在透彻讲解底层原理(如GPU运算、内存估算)之后,手把手指导学员进行显卡驱动配置、Docker部署、量化脚本执行与性能评测,帮助学员掌握从模型压缩、运行时加速到生产级分布式部署的完整技能栈。

下载地址

网盘 链接 提取码
夸克网盘 点击前往

如果链接失效,请 联系管理员 获取最新链接。

分享:
  • 标题: 51CTO-崔浩-LLM 推理优化与部署实战**
  • 作者: KODABOX
  • 创建于 : 2026-03-10 14:20:51
  • 更新于 : 2026-03-11 17:13:33
  • 链接: https://www.kodabox.club/其他资源/2026-03-10-51CTO-崔浩-LLM-推理优化与部署实战/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论
目录
51CTO-崔浩-LLM 推理优化与部署实战**