1. 首页
  2. 游戏开发
  3. 其他
  4. 英伟达推出新GPU加速语言模型推理,类似ChatGPT处理成本降10倍

英伟达推出新GPU加速语言模型推理,类似ChatGPT处理成本降10倍

上传者: 2023-05-17 19:52:18上传 ZIP文件 1.24MB 热度 13次

“我们正处于AI的‘iPhone时刻’。”78分钟的GTC演讲过程中,NVIDIA(英伟达)创始人兼首席执行官黄仁勋提了三次这一观点。为了支持大型语言模型的处理成本降低一个数量级,英伟达推出了一款新GPU,是带有双GPU NVLink的H100 NVL。同时基于NVIDIA Hopper架构的H100配有一个Transformer引擎,是为处理驱动ChatGPT的类似模型,相比用于GPT3处理的HGX A100来看,配备四对H100和双GPU NVLink的标准服务器速度最高可达10倍。

下载地址
用户评论