Python基于OCR的视觉注意VisualAttention
基于OCR的视觉注意(VisualAttention)。该模型首先在图像(调整图像为高度32,同时保持纵横比)上运行一个滑动CNN。然后在CNN顶端堆叠一个LSTM。最后,一个视觉模型作为解码器,用来生成最终结果
下载地址
用户评论