微软开源“傻瓜式”ChatGPT模型训练工具,速度提升15倍,成本大幅降低
微软近日宣布开源DeepSpeed-Chat,帮助用户轻松训练类ChatGPT等大型语言模型。该模型训练工具基于微软DeepSpeed深度学习优化库开发,具备训练、强化推理等多种功能,同时使用了RLHF(基于人类反馈的强化学习)技术,训练速度能提升15倍以上,而成本却大幅降低。使用DeepSpeed-Chat的“傻瓜式”操作,用户能以最短的时间、最高效的成本训练类ChatGPT大语言模型。ChatGPT及类似模型引发了AI行业的一场风潮,ChatGPT类模型能够执行归纳、编程、翻译等任务,其结果与人类专家相当甚至更优。为了能够更加轻松地训练和部署ChatGPT等模型,AI开源社区进行了各种尝试,如ChatLLaMa、ChatGLM-6B、Alpaca、Vicuna、Databricks-Dolly等。
下载地址
用户评论
个人感觉这个工具的训练效果非常值得期待,推荐大家试用一下。
这个工具真是太好用了,训练速度也快,非常方便。
运行这个工具后训练速度飞快,简直不输给GPU加速了。
性价比非常高的工具,非常适合初学者使用。
实测使用这个工具,训练的速度提升了好几倍,效果也还不错。