infinibatch:高效经过检查的数据加载可通过海量数据集进行深度学习 源码
Infini批次 Infinibatch是一个可检查点的迭代器库,用于在深度神经网络训练中对海量数据集进行随机数据加载。 特征 对语料库的支持远大于RAM 整个语料库上的分层块+句子级随机化,每个时期不同的随机化 仅加载所需的数据 启动时间非常快(不需要阅读完整的语料库) 只需要最基本的数据准备(例如,无索引) 对于多GPU,仅加载相应GPU的需求 100%准确的检查点,从检查点还原不应读取所有数据直至检查点 支持具有动态批次大小的自动桶装批次 预取线程 可组合的,以支持复杂的批处理,例如来自多个文档的阴性样品 入门 Infinibatch需要Python 3.5,并且没有依赖项。 目前
下载地址
用户评论