1. 首页
  2. 人工智能
  3. 机器学习
  4. 全球机器学习技术大会张君大模型推理加速优化实践

全球机器学习技术大会张君大模型推理加速优化实践

上传者: 2025-08-15 04:40:42上传 PDF文件 7.29MB 热度 46次

如果你关注机器学习领域的最新动态,那张君的分享应该会让你眼前一亮。作为昇腾生态的技术专家,张君深入探讨了大模型推理加速的技术挑战和优化实践。是他提到的三个挑战,真的是让人大开眼界。第一个是大模型带来的计算和内存负担,模型参数一多,计算资源就跟不上,导致推理速度慢、成本高。第二个是推理过程中的延迟和吞吐量问题,尤其是推理过程有两个阶段,算力利用率低,不同求时的延迟也差异大。一个挑战则是从单模态到多模态的转变,随着应用场景的拓展,推理成本也随之增加。面对这些问题,张君提出了昇腾硬件的优化方案,像 MindIE-LLM 框架和 ATB 加速库都是不错的实践,能在硬件和算法上双管齐下提高推理性能。如果你也在搞大模型推理,借鉴这些优化实践会有。张君的工作不仅是理论研究,更有实际应用的创新,给了多启发。

下载地址
用户评论