计算机科学 ›› 2017, Vol. 44 ›› Issue (Z6): 551-556.doi: 10.11896/j.issn.1002-137X.2017.6A.123
王伟,陈志高,孟宪凯,李伟
WANG Wei, CHEN Zhi-gao, MENG Xian-kai and LI Wei
摘要: 介绍了一种基于熵的音频指纹检索技术,该技术采用音频的熵特征作为音频的指纹特征(AFP),在检索中,该指纹特征可以用多种串匹配算法进行信息比对。实验采用最大公共字串(LCS)、编辑距离(Levenshtein Distance)和动态时间规整(DTW)算法实现指纹特征匹配,并采用一定数量的歌曲文件作为实验的测试集。每首歌曲都有一个带有不同的较大失真的音频文件或由不同歌唱家演唱的不同版本,这些带有不同的较大失真的音频文件由原曲经过不同的严重音频处理得到,比如添加噪声、加快速度、剪辑等。实验结果显示,使用的3种匹配算法均可以将训练集中所有的歌曲正确地识别出来,从而证明了基于熵的音频指纹检索技术具有准确性、鲁棒性、区分性等优良性质。
[1] 李伟,李晓强,陈芳,等.数字音频指纹技术综述[J].小型微型计算机系统,2008,29(11):2124-2130. [2] FRAGOULIS D,ROUSOPOULOS G,PANAGOPOULOS T,et al.On the automated recognition of seriously distorted musical recordings [J].IEEE Transactions on Signal Processing,2001,49(4):898-908. [3] LOGAN B.Mel Frequency Cepstral Coefficients for Music Mode-ling[C]∥International Symposium on Music Information Retrieval.2000. [4] ALLAMANCHE E,HERRE J,HELMUTH O,et al.Audioid:Towards content-based identification of audio material [C]∥Proc Aes Convention.2001. |
No related articles found! |
|