TensorFlow实现模型断点训练,checkpoint模型载入方式
深度学习中,模型训练一般都需要很长的时间,由于很多原因,导致模型中断训练,下面介绍继续断点训练的方法。需要到Log文件夹中,查看当前迭代的次数,如下:此时为111000次。训练到167000次后,载入模型重新训练。原始设置的迭代的次数为1000000,已经训练了167000次。保存的图片仍然从头开始编号,会覆盖掉之前的图片。以前对应编号的采样图片为:若有朋友有高见,还请不吝赐教。checkpoint 保存路径model_path下存有包含多个迭代次数的模型1.获取最新保存的模型即上图中的model-94002.获取某个迭代次数的模型比如上图中的model-9200获取变量值
用户评论