基于说话人的音频分割与聚类
李稀敏,洪青阳,黄晓丹(厦门大学智能科学与技术系,福建厦门361005)说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说话人聚类。本文主要就这三个方面展开叙述,全面地介绍了各类算法。
下载地址
用户评论