[發明專利]一種音頻片斷之間相似度度量的方法有效
| 申請號: | 200610080669.1 | 申請日: | 2006-05-25 |
| 公開(公告)號: | CN101079044A | 公開(公告)日: | 2007-11-28 |
| 發明(設計)人: | 彭宇新;房翠華;陳曉鷗;吳於茜 | 申請(專利權)人: | 北大方正集團有限公司;北京大學;北京北大方正技術研究院有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 | 代理人: | 李欣 |
| 地址: | 100871北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 片斷 之間 相似 度量 方法 | ||
1、一種度量兩個音頻片斷之間相似度的方法,其特征在于,包括以下步驟:
(1)分別將待度量的音頻片斷分割為多個音質相似的音頻單元;其中音頻單元是一系列音質相似的音頻幀;
(2)計算上述兩個音頻片斷中任意兩個音頻單元之間的相似度;
(3)把兩個音頻片斷的相似度度量建模為一個帶權二分圖;
(4)運用最優匹配度量兩個音頻片斷之間的相似度;
(5)采用以下公式計算兩個音頻片斷之間的相似度:
∑ωij表示兩個音頻片斷最優匹配取得的最大相似度,p和q分別表示兩個音頻片斷X和Y的音頻單元數目。
2、如權利要求1所述的一種音頻片斷之間相似度度量的方法,其特征在于:步驟(1)中,運用貝葉斯信息標準,將待度量的音頻片斷分割為多個音質相似的音頻單元。
3、如權利要求1所述的一種音頻片斷之間相似度度量的方法,其特征在于:步驟(2)中,使用如下公式計算兩個音頻單元的相似度:
Sim(si,sj)=exp(-Distance(si,sj)/2)
其中,si和sj表示兩個音頻單元,Distance(si,sj)表示si和sj音頻特征向量的歐式距離。
4、如權利要求3所述的一種音頻片斷之間相似度度量的方法,其特征在于:步驟(2)中,音頻單元的特征向量,是采用該音頻單元中所有音頻幀的特征向量的平均值表示。
5、如權利要求4所述的一種音頻片斷之間相似度度量的方法,其特征在于:步驟(2)中,音頻幀的特征向量采用的是對數能量和梅爾倒頻譜系數組成的13維特征向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京大學;北京北大方正技術研究院有限公司,未經北大方正集團有限公司;北京大學;北京北大方正技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610080669.1/1.html,轉載請聲明來源鉆瓜專利網。





