环境声音为视觉学习提供监督论文解读 上传者:ylmbtm 2019-09-06 22:54:00上传 MD文件 6.65KB 热度 22次 声音传达了关于我们周围世界的重要信息——咖啡馆的喧嚣告诉我们附近有很多人,发动机的噪声低吼声让我们注意快速行驶的汽车,等等。利用音频信号与视觉信息之间的自然同步,并发的视觉和声音信息提供了丰富的训练信号,可用来学习视觉世界的有用表示。训练预测视觉场景内发生的声音的算法可用来学习与突出和独特的噪声相关的物体和场景原始(例如如人、汽车、流水等),这样的算法还可以学习将视觉场景与在其中发生的环境声音纹理相关联。文中展示了一个基于视觉CNN和声音纹理的模型,可预测视频帧中的自然声音,从而学习传达语义上有意义信息的视觉表示。 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论 ylmbtm 资源:1 粉丝:0 +关注 上传资源 免责说明 本站只是提供一个交换下载平台,下载的内容为本站的会员网络搜集上传分享交流使用,有完整的也有可能只有一分部,相关内容的使用请自行研究,主要是提供下载学习交流使用,一般不免费提供其它各种相关服务! 本站内容泄及的知识面非常广,请自行学习掌握,尽量自已动脑动手解决问题,实践是提高本领的途径,下载内容不代表本站的观点或立场!如本站不慎侵犯你的权益请联系我们,我们将马上处理撤下所有相关内容!联系邮箱:server@dude6.com