Mazzikaa:该项目的目的是开发一种乐谱阅读器。 该字段称为光学音乐识别(OMR)。 其目的是将活页乐谱转换为机器可读的版本。 我们采用简化版本将乐谱图像转
马齐卡 该项目的目的是开发一种乐谱阅读器。 该字段称为光学音乐识别(OMR)。 其目的是将活页乐谱转换为机器可读的版本。 我们采用简化版本,将乐谱的图像转换为文本表示形式可以进一步处理以生成Midi文件或音频文件,例如wav或mp3。 执行: 二值化: 第一步是对输入图像进行二值化,尽管看起来很简单,但是当使用某些二值化技术时,一些测试用例会产生不希望的输出。 这意味着,如果我们使用Otsu,则大多数情况下它将输出精确的二进制图像,特别是当输入图像是扫描的乐谱时。 但是,如果输入图像是通过相机捕获的,则Otsu会在图像中产生大量噪点,并使后续处理步骤更加困难。 另一方面,自适应阈值处理可以在几乎没有噪声的情况下在相机捕获的图像上获得出色的结果,但是在扫描的图像上,它会丢失特别重要的图像信息。 特别是,它会在最初填充的音符头内部产生Kong,这会导致以后的错误检测和分类。 因此,在观察输入
用户评论