PyTorch:模型参数读取与设置–以FlowNetSimple为例
一、背景 在“搞”深度学习时,除非富如东海,往往都不会直接用大量数据来训练一个网络;一般情况下,比较省钱且高效的思路是利用一些预训练的模型,并在其基础上进行再训练优化,达到自己的目的。 因此,在本博客中将简单记录一下,如何在PyTorch基础上读取预训练模型的参数,并添加到自己的模型中去,从而尽可能减少自己的计算量。 为了直接讲明整个过程,本文设计了一个实验,首先设计了一个网络,其前半部分与FlowNetSimple的Encode一致,后半部分是全连接的分类网络。 下图是FlowNetSimple的网络结构,其中的refinement部分是Decode结构(类似UNet) 本文设计的结构,其
用户评论