[發(fā)明專(zhuān)利]基于核范數(shù)的魯棒音階輪廓特征提取算法有效
| 申請(qǐng)?zhí)枺?/td> | 201611132721.3 | 申請(qǐng)日: | 2016-12-09 |
| 公開(kāi)(公告)號(hào): | CN106782583B | 公開(kāi)(公告)日: | 2020-04-28 |
| 發(fā)明(設(shè)計(jì))人: | 李鏘;王蒙蒙;關(guān)欣 | 申請(qǐng)(專(zhuān)利權(quán))人: | 天津大學(xué) |
| 主分類(lèi)號(hào): | G10L21/013 | 分類(lèi)號(hào): | G10L21/013;G10L21/0224;G10L21/0232;G10L25/18;G10L25/45 |
| 代理公司: | 天津市北洋有限責(zé)任專(zhuān)利代理事務(wù)所 12201 | 代理人: | 李素蘭 |
| 地址: | 300072*** | 國(guó)省代碼: | 天津;12 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 范數(shù) 音階 輪廓 特征 提取 算法 | ||
本發(fā)明公開(kāi)了一種專(zhuān)基于核范數(shù)的魯棒音階輪廓特征提取算法,步驟1、待輸入音樂(lè)信號(hào)轉(zhuǎn)換;步驟2、對(duì)音樂(lè)信號(hào)進(jìn)行加窗處理,并進(jìn)行傅立葉變換,得到音樂(lè)信號(hào)的時(shí)頻矩陣,確定起始節(jié)拍點(diǎn);步驟3、利用核范數(shù)約束對(duì)時(shí)頻矩陣的秩進(jìn)行頻譜低秩化;同時(shí)用一范數(shù)約束矩陣中的噪聲點(diǎn),用以下凸優(yōu)化問(wèn)題對(duì)信號(hào)頻譜進(jìn)行低秩化,并去除噪聲;步驟4、在迭代約束過(guò)程中,利用頻譜的低秩特性,實(shí)現(xiàn)閾值自適應(yīng)調(diào)整算法;步驟5、對(duì)時(shí)頻矩陣進(jìn)行有效的降維處理,得到12維的和弦特征。與現(xiàn)有技術(shù)相比,本發(fā)明提取出了魯棒性的和弦特征;有效地降低了算法的時(shí)間;能準(zhǔn)確地恢復(fù)不同類(lèi)型和風(fēng)格的音樂(lè)信號(hào)的音階輪廓特征。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)聽(tīng)覺(jué)系統(tǒng)中的音頻信號(hào)分析領(lǐng)域,特別是涉及一種音階輪廓特征提取算法。
背景技術(shù)
音樂(lè)的諧波成分是音樂(lè)的重要元素,是音樂(lè)信息檢索領(lǐng)域的重要課題。音頻信號(hào)的不同頻率的基頻及其諧波成分是構(gòu)成和弦并影響音樂(lè)色彩的重要成分。另外,不同頻率成分在時(shí)間上的延伸時(shí)構(gòu)成和弦行進(jìn)的關(guān)鍵因素。直觀的講,和弦持續(xù)時(shí)間內(nèi)的音樂(lè)在頻域會(huì)呈現(xiàn)一定的結(jié)構(gòu)性——低秩特性。音樂(lè)的和弦特征提取屬于計(jì)算機(jī)聽(tīng)覺(jué)系統(tǒng)中的音頻信號(hào)分析中的一部分,這個(gè)領(lǐng)域主要處理從聲音信號(hào)中分離出來(lái)的各種各樣的信息。同時(shí),音樂(lè)的和弦特征也是提取一些高級(jí)音樂(lè)信息的基礎(chǔ)。
音樂(lè)的中級(jí)特征是指從音頻信號(hào)中提取出來(lái)的,并能夠表示音頻信號(hào)的信息,最終能夠作為高級(jí)特征的一部分。近年來(lái),有許多學(xué)者提出了多種能夠表征音樂(lè)的中級(jí)特征。其中應(yīng)用最為廣泛的就是音級(jí)輪廓特征(Pitch Class Profiles,PCP)。然而,由于原始音樂(lè)信號(hào)中包含有人聲、鼓點(diǎn)、爆破音以及高斯噪聲,使得PCP特征性能的好壞與要分析的音樂(lè)信號(hào)的類(lèi)型有很大的關(guān)系。有許多學(xué)者提出了基于PCP的改進(jìn)方案,例如,Gomez提出的HPCP(Harmonic PCP),Lee提出的EPCP(Enhanced PCP)。這些方案都從改變頻域提取成分著手,進(jìn)而得到適合于特定音樂(lè)類(lèi)型的性能優(yōu)越的特征。
另外,從和弦行進(jìn)來(lái)講,由于每個(gè)和弦都有一定的持續(xù)時(shí)間,在這段時(shí)間內(nèi)PCP特征的穩(wěn)定性決定了和弦識(shí)別的準(zhǔn)確率。有許多學(xué)者提出了基于PCP行進(jìn)-chromagram的改進(jìn)方案。Fujisjima假定和弦持續(xù)數(shù)幀,采用滑動(dòng)窗均值濾波,從而減少噪聲的影響,并且避免了和弦頻繁變化;GeoffroyPeeters采用滑動(dòng)窗中值濾波,來(lái)避免和弦的頻繁變化;Bello假定和弦在一個(gè)節(jié)拍內(nèi)是不變化的,使用節(jié)拍同步技術(shù)來(lái)避免和弦頻繁變化。
大部分節(jié)拍跟蹤模型由音符端點(diǎn)檢測(cè)、端點(diǎn)強(qiáng)度曲線周期提取兩部分組成。不論哪種模型,端點(diǎn)檢測(cè)的根本目的都是選取有效的端點(diǎn)曲線的峰值,其本質(zhì)上是極值點(diǎn)是否為節(jié)拍點(diǎn)的聚類(lèi)問(wèn)題。
可見(jiàn),大部分和弦特征提取方案都未考慮音樂(lè)信號(hào)在頻譜上表現(xiàn)出來(lái)的結(jié)構(gòu)性,應(yīng)用一些已知的假設(shè),從而采用一些簡(jiǎn)單的處理方法來(lái)優(yōu)化和弦特征。
發(fā)明內(nèi)容
基于現(xiàn)有技術(shù),本發(fā)明提出了一種基于核范數(shù)的魯棒音階輪廓特征提取算法,將和弦特征提取問(wèn)題轉(zhuǎn)化為凸優(yōu)化問(wèn)題,利用核范數(shù)約束和一范數(shù)約束,同時(shí),利用和弦的頻譜所表現(xiàn)出來(lái)的低秩特性,實(shí)現(xiàn)了閾值自適應(yīng)算法。
本發(fā)明的一種專(zhuān)基于核范數(shù)的魯棒音階輪廓特征提取算法,該算法包括以下步驟:
步驟1、將待輸入音樂(lè)信號(hào)轉(zhuǎn)換為采樣率22050Hz/16bit/單通道的標(biāo)準(zhǔn)音頻,作為被參考的音頻信號(hào)x(n),其中n為轉(zhuǎn)換后音頻信號(hào)所包含的數(shù)據(jù)點(diǎn)數(shù);
步驟2、對(duì)音樂(lè)信號(hào)x(n)進(jìn)行加窗處理,窗函數(shù)為W(k),其中k為窗函數(shù)的窗口寬度,從而得到信號(hào)時(shí)域矩陣Xk×m,其中X·,m=x(k·m/2:k·m/2+m)·W(k),m為分幀之后得到的幀數(shù),然后進(jìn)行傅立葉變換(Fourier Transform),得到音樂(lè)信號(hào)的時(shí)頻矩陣D=F·X,其中F為傅里葉變換矩陣;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611132721.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G10L 語(yǔ)音分析或合成;語(yǔ)音識(shí)別;音頻分析或處理
G10L21-00 為了改變語(yǔ)音信號(hào)的質(zhì)量或其可識(shí)度而處理語(yǔ)音信號(hào),以產(chǎn)生另一種可聽(tīng)的或非可聽(tīng)的信號(hào),例如視覺(jué)信號(hào)或觸覺(jué)信號(hào)
G10L21-02 .語(yǔ)音增強(qiáng),例如降低噪聲或消除回聲
G10L21-04 .時(shí)間壓縮或擴(kuò)展
G10L21-06 .將語(yǔ)音轉(zhuǎn)換成非可聽(tīng)表達(dá)形式,例如語(yǔ)音可視化、觸覺(jué)輔助的語(yǔ)音處理
- 音頻信號(hào)的瞬態(tài)檢測(cè)
- 一種多視圖網(wǎng)絡(luò)垃圾頁(yè)面檢測(cè)方法
- 一種混合范數(shù)的高質(zhì)量快速CS-MRI成像方法
- 基于FPGA的可配置浮點(diǎn)向量范數(shù)求解IP核
- 基于耦合電流信號(hào)超范數(shù)的電磁脈沖多端口效應(yīng)評(píng)估方法
- 神經(jīng)網(wǎng)絡(luò)處理裝置及其執(zhí)行向量范數(shù)指令的方法
- 一種基于原子范數(shù)的到達(dá)角估計(jì)方法
- 室內(nèi)混合稀疏LOS/NLOS場(chǎng)景下的L0范數(shù)定位方法
- 一種基于改進(jìn)的截?cái)嗪朔稊?shù)的魯棒主成分分析方法
- 深度學(xué)習(xí)模型對(duì)抗樣本生成方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)





