[發(fā)明專利]一種基于音頻特征誘導(dǎo)信息增強(qiáng)的音樂自動(dòng)標(biāo)記方法有效
| 申請?zhí)枺?/td> | 201810815313.0 | 申請日: | 2018-07-24 |
| 公開(公告)號(hào): | CN109102006B | 公開(公告)日: | 2021-09-07 |
| 發(fā)明(設(shè)計(jì))人: | 張敏靈;張倩汶 | 申請(專利權(quán))人: | 東南大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 211100 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 音頻 特征 誘導(dǎo) 信息 增強(qiáng) 音樂 自動(dòng) 標(biāo)記 方法 | ||
1.一種基于音頻特征誘導(dǎo)信息增強(qiáng)的音樂自動(dòng)標(biāo)記方法,其特征在于,其包括以下步驟:
(1)定義第m個(gè)屬性的訓(xùn)練集表示為Dm={(xi,Yi)|1≤i≤Qm},其中,xi表示第i個(gè)音樂樣本的特征向量,Yi表示第i個(gè)音樂樣本的標(biāo)記向量,訓(xùn)練集Dm由Qm個(gè)音樂樣本組成;標(biāo)記向量Yi=[ti1,...,tij,...,tiN]由N個(gè)標(biāo)記組成,tij是第i個(gè)樣本的第j個(gè)標(biāo)記的標(biāo)記值,設(shè)置每一個(gè)標(biāo)記值對(duì)應(yīng)一個(gè)標(biāo)記;當(dāng)tij=1表示第i個(gè)樣本的第j個(gè)標(biāo)記為相關(guān)標(biāo)記;當(dāng)tij=-1表示第i個(gè)樣本的第j個(gè)標(biāo)記為無關(guān)標(biāo)記;
(2)獲得M個(gè)屬性的訓(xùn)練集Dm,m=1,2,...,M,利用稀疏表示方法得到結(jié)構(gòu)矩陣Um,并獲得標(biāo)記增強(qiáng)信息Rm,M表示屬性個(gè)數(shù),m表示屬性序號(hào);獲得稀疏表示方法得到結(jié)構(gòu)矩陣Um和獲得標(biāo)記增強(qiáng)信息Rm方法如下:
(2.1)獲取音樂數(shù)據(jù)集屬性個(gè)數(shù)M,初始化當(dāng)前處理屬性序號(hào)m=1;
(2.2)獲取當(dāng)前屬性序號(hào)下,訓(xùn)練集樣本個(gè)數(shù)Qm,初始化當(dāng)前處理樣本序號(hào)q=1;
(2.3)令i=q,特征向量xi作為學(xué)習(xí)目標(biāo),將訓(xùn)練集剩余特征向量X′i={X-xi}作為字典,X為訓(xùn)練集特征向量集合X={xi|1≤i≤Qm},利用字典X′i對(duì)xi進(jìn)行重構(gòu),通過交替方向乘子法最小化求解公式(1),獲得重構(gòu)系數(shù)向量ai:
norm(,′inf′)是行和最大值運(yùn)算,’inf’表示設(shè)置無窮范數(shù),|| ||2是二范數(shù)運(yùn)算,|| ||1是一范數(shù)運(yùn)算;
(2.4)遞增q,q=q+1,重復(fù)步驟(2.3)~(2.4),直到q>Qm,計(jì)算出Qm個(gè)重構(gòu)系數(shù)向量ai,i=1,2,...,Qm,構(gòu)造Qm×Qm維結(jié)構(gòu)矩陣uij表示結(jié)構(gòu)矩陣Um的第i行第j列的元素,j=1,2,...,Qm,結(jié)構(gòu)矩陣Um的a11表示重構(gòu)系數(shù)向量a1的第1個(gè)元素,表示重構(gòu)系數(shù)向量a1的第Qm-1個(gè)元素,其它可類推;
(2.5)利用步驟(2.4)得到的結(jié)構(gòu)矩陣Um通過二次規(guī)劃法求解最小化公式(2),獲得標(biāo)記增強(qiáng)信息
公式(2)使用符號(hào)一致性tijrij≥0約束,uji是結(jié)構(gòu)矩陣Um的第j行第i列的元素,tij是矩陣第i行第j列的元素,是Qm×N維增強(qiáng)信息矩陣,rij是矩陣Rm第i行第j列的元素,ri表示矩陣Rm的第i行,rj表示矩陣Rm的第j行;
(2.6)遞增m,m=m+1,重復(fù)步驟(2.2)~(2.6),依次計(jì)算M個(gè)屬性對(duì)應(yīng)的M個(gè)標(biāo)記增強(qiáng)信息Rm,m=1,2,...,M;
(3)利用標(biāo)記增強(qiáng)信息Rm,通過多輸出支持向量機(jī)回歸方法得到分類預(yù)測模型{W(m),b(m)},m=1,2,...,M,W(m)是第m個(gè)屬性預(yù)測模型的權(quán)重矩陣,b(m)是第m個(gè)屬性預(yù)測模型的偏差矢量;
(4)提取待標(biāo)記音樂樣本的特征向量x,輸入分類預(yù)測模型{W(m),b(m)},m=1,2,...,M,實(shí)現(xiàn)自動(dòng)對(duì)輸入的音樂樣本進(jìn)行標(biāo)記。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810815313.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





