Project15 G4 源码
大象柜台 介绍 该库可预测声音文件中的大象数量。 该代码是牛津大学“ 课程的一个项目的可交付成果。 作为和康奈尔大学的的一部分,开发团队接受了在声音文件中计算大象数量的挑战。 文件和结果 该研究项目的解释和结果记录在本回购的演示文稿 中。 还有一个解释了项目团队的结果。 参考文献 建筑学 该库实质上是一个数据管道,包括五个主要步骤: 细分数据:基于康奈尔大学创建的元数据文件,我们创建了几秒钟包含“有趣信息”的细分 频谱图:将每个数据段转换成时间与频率的2D图像,即spectrogram 单色:减少每个频谱图的噪声并将其转换为简单的单色(黑白)图像 轮廓检测:使用轮廓检测算法对每个单色图像进行评估,以区分单独的“对象”,在我们的案例中是大象的隆隆声 拳击:对于每个轮廓(潜在的象隆隆声),我们通过在轮廓周围绘制一个框来计算尺寸(高度和宽度) 计数:我们将每个频谱图中识别隆隆声的
用户评论