[發明專利]一種音頻片斷之間相似度度量的方法有效
| 申請號: | 200610080669.1 | 申請日: | 2006-05-25 |
| 公開(公告)號: | CN101079044A | 公開(公告)日: | 2007-11-28 |
| 發明(設計)人: | 彭宇新;房翠華;陳曉鷗;吳於茜 | 申請(專利權)人: | 北大方正集團有限公司;北京大學;北京北大方正技術研究院有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同達信恒知識產權代理有限公司 | 代理人: | 李欣 |
| 地址: | 100871北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 片斷 之間 相似 度量 方法 | ||
技術領域
本發明屬于音頻檢索技術領域,具體涉及一種音頻片斷之間相似度度量的方法。
背景技術
隨著多媒體資料及應用的不斷增多,音頻分析及檢索技術變得越來越重要,而音頻片斷檢索是上述技術的一種重要形式,即用戶給定一個音頻片斷,怎樣自動從音頻庫里檢索到相似的音頻片斷,并按照相似度從高到低排序。現有的音頻檢索技術,一般是從音頻片斷中提取出音頻特征,然后利用這些特征進行相似度度量,根據度量結果進行檢索。這種方法因為沒有考慮音頻片斷中具體內容的差別,而采用音頻特征表示整個音頻片斷,因此不能有效度量音頻內容的相似度。
2004年在Pacific-Rim?Conference?on?Multimedia發表的文獻“DominantFeature?Vectors?Based?Audio?Similarity?Measure”(作者是J.Gu,L.Lu,R.Cai,H.J.Zhang?and?J.Yang,頁碼是890-897),提出了一種基于音頻特征矩陣的特征向量和特征值的音頻特征:主特征向量(Dominant?Feature?Vectors)。該文獻提取出音頻片段的幀特征定義成一個特征幀矩陣,然后計算這個矩陣的自相關矩陣,最后計算自相關矩陣的特征向量和特征值作為音頻片段特征。該方法是基于整個音頻片段的統計特征,因此無法描述音頻片斷中的內容變化特性,從而限制了音頻檢索的準確度。
發明內容
針對現有技術的不足,本發明提出一種音頻片斷相似度度量的方法,用于度量不同音頻片斷之間的相似度。
為達到以上目的,本發明采用的技術方案是:一種音頻片斷之間相似度度量的方法,包括以下步驟:
(1)分別將待度量的音頻片斷分割為多個音質相似的音頻單元;其中音頻單元是一系列音質相似的音頻幀;
(2)計算上述兩個音頻片斷中任意兩個音頻單元之間的相似度;
(3)把兩個音頻片斷的相似度度量建模為一個帶權二分圖;
(4)運用最優匹配度量兩個音頻片斷之間的相似度;
(5)采用以下公式計算兩個音頻片斷之間的相似度:
∑ωij表示兩個音頻片斷最優匹配取得的最大相似度,p和q分別表示兩個音頻片斷X和Y的音頻單元數目。
更進一步,運用貝葉斯信息標準(Bayesian?Information?Criterion,BIC),將待度量的音頻片斷分割為多個音質相似的音頻單元。
更進一步,使用如下公式計算兩個音頻單元的相似度:
Sim(si,sj)=exp(-Distan(si,sj)/2)
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北大方正集團有限公司;北京大學;北京北大方正技術研究院有限公司,未經北大方正集團有限公司;北京大學;北京北大方正技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610080669.1/2.html,轉載請聲明來源鉆瓜專利網。





