全球机器学习技术大会张君大模型推理加速优化实践

Name: 全球机器学习技术大会张君大模型推理加速优化实践
Rating: 4.5 (71 reviews)
Author: sake_20414

上传者：sake_20414 2025-08-15 04:40:42上传 PDF文件 7.29MB 热度 71次

如果你关注机器学习领域的最新动态，那张君的分享应该会让你眼前一亮。作为昇腾生态的技术专家，张君深入探讨了大模型推理加速的技术挑战和优化实践。是他提到的三个挑战，真的是让人大开眼界。第一个是大模型带来的计算和内存负担，模型参数一多，计算资源就跟不上，导致推理速度慢、成本高。第二个是推理过程中的延迟和吞吐量问题，尤其是推理过程有两个阶段，算力利用率低，不同求时的延迟也差异大。一个挑战则是从单模态到多模态的转变，随着应用场景的拓展，推理成本也随之增加。面对这些问题，张君提出了昇腾硬件的优化方案，像 MindIE-LLM 框架和 ATB 加速库都是不错的实践，能在硬件和算法上双管齐下提高推理性能。如果你也在搞大模型推理，借鉴这些优化实践会有。张君的工作不仅是理论研究，更有实际应用的创新，给了多启发。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

全球机器学习技术大会张君大模型推理加速优化实践

如果你关注机器学习领域的最新动态，那张君的分享应该会让你眼前一亮。作为昇腾生态的技术专家，张君深入探...

大小：7.29MB | 2025-08-15 04:40:42
全球机器学习技术大会吴凌翔多模态大模型实践与思考

多模态大模型的实践经验分享，挺适合你这种想把 AI 用到实际项目里的前端人看看。吴凌翔在会上讲了不少...

大小：23.97MB | 2025-08-15 01:26:54
全球机器学习技术大会彭厚文腾讯混元多模态大模型技术实践

腾讯混元多模态大模型技术实践挺有意思的，涵盖了人工智能的多个前沿领域。彭厚文团队在多模态基础模型研发...

大小：11.15MB | 2025-08-15 01:12:54
全球机器学习技术大会刘松伟AIGC模型量化与稀疏优化

全链路优化的大模型推理经验分享，刘松伟在全球机器学习大会讲得挺干货。AIGC 模型怎么通过量化、稀疏...

大小：13.46MB | 2025-08-15 00:35:18
全球机器学习技术大会-蒋思源-提升代码生成质量：代码大模型实践经验

全球机器学习技术大会-蒋思源-提升代码生成质量：代码大模型实践经验

大小：15.22MB | 2025-07-08 12:38:25
2017全球机器学习技术大会会刊

以机器学习为代表的人工智能技术已经被公认为未来5~10年技术变革的浪潮,它必将全方位改变未来人们的工...

大小：143.74MB | 2020-08-21 08:19:10
全球机器学习技术大会李夕瑞腾讯Angel大模型一站式平台工程实践

全球机器学习技术大会的这场讲座，李夕瑞带来了腾讯 Angel 大模型的一站式平台工程实践。深入浅出，...

大小：16.36MB | 2025-08-15 00:24:37
2017全球机器学习大会资料汇总

2017全球机器学习大会资料汇总，包含了所有演讲的PPT材料

大小：0B | 2019-07-13 23:53:33
豆包MarsCode智能代码补全实践分享——全球机器学习技术大会·江波

豆包 MarsCode 的智能编程功能，真的是前端写代码时的一个小助手。江波在全球机器学习技术大会上...

大小：12.49MB | 2025-07-07 21:40:34
全球机器学习技术大会马永亮构建企业高价值场景的AI应用RAG、数值计算与推理技术实践

AI 大会上的马永亮分享挺有意思的，尤其是他聊到RAG、数值计算和推理落地的那些事。澜舟科技走的是自...

大小：15.03MB | 2025-08-15 00:54:35
全球机器学习技术大会毛航宇强化学习与多智能体系统大语言模型应用

如果你对强化学习和多智能体系统感兴趣，这些资源绝对值得一看！毛航宇的多智能体强化学习，结合了丰富的实...

大小：9.82MB | 2025-08-15 01:03:06
2018全球机器学习大会演讲稿

2018全球机器学习大会演讲稿合辑。01.迈克尔·乔丹：机器学习前沿发展.pdf02.Michael...

大小：0B | 2020-05-24 11:24:52
全球机器学习技术大会刘广Infinity Instruct合成指令技术探索

刘广的 Infinity Instruct 技术，简直是合成指令领域的一次突破。他深入探讨了如何通过...

大小：17.24MB | 2025-08-15 00:32:57
机器学习实践机器学习实践源码

主要模块 scikit学习分类评价例 feature_selection 预处理回归强化学...

大小：70KB | 2021-02-07 05:08:53
全球机器学习技术大会-刘长波WPS AI技术探索与办公自动化实践

WPS AI 的办公自动化探索，真是挺有意思的。刘长波在会上聊了不少干货，比如RAG 范式这种玩法，...

大小：13.41MB | 2025-08-15 00:44:51
全球机器学习技术大会王楠检索增强生成RAG的实践挑战与发展

在全球机器学习技术大会上，Jina AI 的王楠博士分享了他在检索增强生成（RAG）领域的实践与挑战...

大小：11.86MB | 2025-08-15 01:21:53