[發(fā)明專利]基于核范數(shù)的魯棒音階輪廓特征提取算法有效
| 申請?zhí)枺?/td> | 201611132721.3 | 申請日: | 2016-12-09 |
| 公開(公告)號: | CN106782583B | 公開(公告)日: | 2020-04-28 |
| 發(fā)明(設(shè)計)人: | 李鏘;王蒙蒙;關(guān)欣 | 申請(專利權(quán))人: | 天津大學(xué) |
| 主分類號: | G10L21/013 | 分類號: | G10L21/013;G10L21/0224;G10L21/0232;G10L25/18;G10L25/45 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 李素蘭 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 范數(shù) 音階 輪廓 特征 提取 算法 | ||
1.一種基于核范數(shù)的魯棒音階輪廓特征提取算法,其特征在于,該算法包括以下步驟:
步驟(1)、將待輸入音樂信號轉(zhuǎn)換為采樣率22050Hz/16bit/單通道的標(biāo)準(zhǔn)音頻,作為被參考的音頻信號x(n),其中n為轉(zhuǎn)換后音頻信號所包含的數(shù)據(jù)點數(shù);
步驟(2)、對音樂信號x(n)進行加窗處理,窗函數(shù)為W(k),其中k為窗函數(shù)的窗口寬度,從而得到信號時域矩陣Xk×m,其中X·,m=x(k·m/2:k·m/2+m)·W(k),m為分幀之后得到的幀數(shù),然后進行傅立葉變換(Fourier Transform),得到音樂信號的時頻矩陣D=F·X,其中F為傅里葉變換矩陣;
步驟(3)、假設(shè)音頻信號頻譜所包含的諧波成分與噪聲是相互獨立的,即D=A+E,其中矩陣A表示頻譜矩陣中所包含的諧波成分做構(gòu)成的矩陣,而E表示頻譜矩陣中所包含的噪聲成分所構(gòu)成的矩陣;根據(jù)以上假設(shè),諧波矩陣A的恢復(fù)可以歸結(jié)為以下凸優(yōu)化問題:
s.t.A+E=D
其中||·||*表示矩陣的核范數(shù),即矩陣的奇異值之和;||·||1表示矩陣的一范數(shù),即所有非零元素之和;分離出來的矩陣A就是低秩化之后的頻譜,而矩陣E則包含稀疏大噪聲以及其他非諧波成分,D則是原始的音樂信號的頻譜;
步驟(4)、在迭代約束過程中,利用頻譜的低秩特性,實現(xiàn)閾值自適應(yīng)調(diào)整算法;具體步驟如下:初始化奇異值截斷閾值參數(shù)μ,參數(shù)λ,迭代索引k=0,臨時矩陣Y0=D,E0為全零矩陣;進行奇異值分解得到奇異值矩陣Σ;接著,從μk到1.5μk等間隔選取二十個數(shù)據(jù)點其中1≤i≤20,對于每個進行奇異值分解逆操作由于諧波成分只分布在數(shù)個頻率點上,因此計算矩陣中某一列的方差,并從中選取使得方差最大時,所對應(yīng)的索引i,并使即完成閾值自適應(yīng)選擇算法;計算這一步得到的矩陣更新Yk+1=Y(jié)k+μk(D-Ak+1-Ek+1)和k=k+1直至收斂;
步驟(5)、對時頻矩陣進行有效的降維處理,得到12維的和弦特征,通常情況下,規(guī)定音符A0處的頻率440Hz為基準(zhǔn)頻率,并通過獲得其他音符處的頻率值,其中b為音符與A0之間的音程差,然后,通過映射公式
來對諧波矩陣A的各個頻率成分進行映射,從而獲得魯棒音階輪廓特征向量,其中x對應(yīng)矩陣A每一行所對應(yīng)的頻率值,而fref則通過獲得。
2.如權(quán)利要求1所述的一種基于核范數(shù)的魯棒音階輪廓特征提取算法,其特征在于,所述閾值自適應(yīng)調(diào)整算法該算法包括以下步驟:
初始化奇異值截斷閾值參數(shù)μ,參數(shù)λ,迭代索引k=0,臨時矩陣Y0=D,E0為全零矩陣;進行奇異值分解得到奇異值矩陣Σ;接著,從μk到1.5μk等間隔選取二十個數(shù)據(jù)點其中1≤i≤20,對于每個進行奇異值分解逆操作由于諧波成分只分布在數(shù)個頻率點上,因此計算矩陣中某一列的方差,并從中選取使得方差最大時,所對應(yīng)的索引i,并使即完成閾值自適應(yīng)選擇算法;計算這一步得到的矩陣更新Yk+1=Y(jié)k+μk(D-Ak+1-Ek+1)和k=k+1直至收斂。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611132721.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 音頻信號的瞬態(tài)檢測
- 一種多視圖網(wǎng)絡(luò)垃圾頁面檢測方法
- 一種混合范數(shù)的高質(zhì)量快速CS-MRI成像方法
- 基于FPGA的可配置浮點向量范數(shù)求解IP核
- 基于耦合電流信號超范數(shù)的電磁脈沖多端口效應(yīng)評估方法
- 神經(jīng)網(wǎng)絡(luò)處理裝置及其執(zhí)行向量范數(shù)指令的方法
- 一種基于原子范數(shù)的到達角估計方法
- 室內(nèi)混合稀疏LOS/NLOS場景下的L0范數(shù)定位方法
- 一種基于改進的截斷核范數(shù)的魯棒主成分分析方法
- 深度學(xué)習(xí)模型對抗樣本生成方法、系統(tǒng)、設(shè)備及存儲介質(zhì)





