[發明專利]一種基于內容計算的音頻標簽傳播方法無效
| 申請號: | 201110197940.0 | 申請日: | 2011-07-15 |
| 公開(公告)號: | CN102262659A | 公開(公告)日: | 2011-11-30 |
| 發明(設計)人: | 蔡晶;郎波;李未 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京科迪生專利代理有限責任公司 11251 | 代理人: | 李新華 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 內容 計算 音頻 標簽 傳播 方法 | ||
技術領域
本發明為利用分析音頻內容得到的音頻相似性來自動為音樂數據集中未標注音樂標簽進行標注。
背景技術
隨著互聯網上數字音樂的爆炸式增長,音樂標簽的重要性越來越突出。音樂標簽一般是對音樂語義進行描述的短文本,其在音樂的檢索、管理與推薦中非常有用。
然而,當前面臨的問題是如何高效地獲取準確的音樂標注。現階段能獲取音樂標注的方法可以歸納為:1、專家標注;2、分類模型訓練;3、社會化標注。但是這些方法都有其優劣:專家標注能獲得準確的標簽,但其標注成本巨大且所獲得的語義信息不夠豐富;分類模型的訓練雖然是自動化方法,但現階段其標注準確率使其還不能進行推廣;而社會化標注能夠獲得較為準確且豐富的標注,并且成本低廉,但其存在大量噪音和長尾效應。
如何能在標注成本、效率、準確性與豐富程度,減少長尾效應上尋求平衡,幫助用戶自動獲取到音樂的標注具有重要意義。
發明內容
本發明要解決的問題:通過對音樂內容分析相似計算,進行現有標簽的傳播,在較好的標注準確性基礎上自動獲取未標注音樂的標簽,減輕了人工標注的工作。
本發明采用的技術方案:一種基于內容計算的音頻標簽傳播方法描述如下:
(1)基于密度的標簽傳播:基于內容相似計算出音頻的相似矩陣,構建音樂網絡,掃描所有未標注音樂,當距離某個未標注音樂α的相似距離不超過L,且最多m個最鄰近音樂上標注率達到P1時,如果某個標簽τ的出現率達到P3,則將標簽τ傳播給α。該獨立過程被稱作基于密度的標簽傳播模型。
(2)基于概率的標簽傳播:對于全體音樂集中的已標注音樂部分集,計算出n*pn率,其中pn即percision?at?n,為某已標注音樂的n個最近鄰居音樂與其具備相同標簽的平均準確率,n∈N,N為自然數,n*pn表示某音樂的鄰近音樂中與其具有相同標簽的音樂個數期望,并將其近似為全體集的n*pn,根據所述期望,計算出某個已標注音樂周圍的相似音樂與其具有相同標簽概率,據此傳播標簽;此獨立的過程被稱作基于概率的標簽傳播模型;
(3)基于上述步驟(1)和(2)分別進行標簽傳播后,求出傳播結果的交集,并將其作為已標注音樂,利用上述步驟(1)或(2)重新進行一次傳播。
所述的步驟(3)進一步包括:
(3a)參數L的取值為,在所有音樂中最近的第m個鄰居距離與最遠的第m個鄰居距離之間min{dim|i∈任意未標注音樂}<L<max{dim|i∈任意未標注音樂},其中,dim代表某未標注音樂i與第m個鄰居的距離。
經過實驗,利用兩種模型的混合的傳播方式,在對未標注音樂有相同召回率情況下,比使用任何一種單獨的模型有更高的準確率,基于概率的傳播準確率比基于密度的傳播準確率略差。
附圖說明
圖1為基于標簽密度的傳播模型示意圖;
圖2為密度傳播模型中距離閾值N取值對準確率影響曲線;
圖3為基于標簽密度與標簽概率模型傳播空間對比;
圖4為本發明的總體流程圖;
圖5為基于標簽概率傳播模型流程圖;
圖6為基于標簽密度傳播模型流程圖;
具體實施方式:
本發明的具體實施方式如下:
(1)輸入數據為一個音頻數據集,其中某些音樂帶有外部標簽,稱其為“已標注音樂”,余下的為“未標注音樂”。提取出所有音頻的20個MFCC特征,并利用單高斯方法對每個音頻進行建模。再利用(Kullback-Leibler?Divergence)即KL距離計算出兩兩音頻之間的相似程度。所有音頻的相似程度形成了一個相似矩陣,單元格[i,j]表示音樂i與音樂j之間的相似性。
(2)基于密度的傳播模型:根據相似矩陣,所有音樂形成了一個關聯的網絡,越相似越接近,如附圖1。接著,掃描所有的未標注音樂,當距離某個未標注音樂α相似距離不超過L,且最多m個最鄰近音樂上標注率達到P1時,如果某個標簽τ的出現率達到P3,則將標簽τ傳播給α。也就是α被標注上了標簽τ,該次傳播的標簽稱為“被傳播標簽”。在該過程中,被傳播標簽不能參與再次傳播。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110197940.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:背側照明的圖像傳感器
- 下一篇:一種用于數控系統中雙環現場總線的安全通信方法
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





