[發明專利]一種基于NMF非負矩陣分解的音頻分離方法無效
| 申請號: | 201210541700.2 | 申請日: | 2012-12-13 |
| 公開(公告)號: | CN103871423A | 公開(公告)日: | 2014-06-18 |
| 發明(設計)人: | 王雷 | 申請(專利權)人: | 上海八方視界網絡科技有限公司 |
| 主分類號: | G10L21/028 | 分類號: | G10L21/028;G10L19/032;G10L15/06 |
| 代理公司: | 上海申新律師事務所 31272 | 代理人: | 袁亞軍 |
| 地址: | 200941 上海市寶*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 nmf 矩陣 分解 音頻 分離 方法 | ||
技術領域
本發明涉及語音信號分解領域,具體涉及一種基于NMF非負矩陣分解的音頻分離方法。
背景技術
當一段音頻當中既混雜有背景的音樂音頻,也有語音音頻時,為了獲取單一的語音音頻或者音樂音頻以便進行相應的編碼、信息檢索等工作,便需要利用相應的算法將混雜的音頻分離為單純的語音音頻與音樂音頻。這樣的一種音頻處理方式,一般會利用信號分離的相關技術來解決。隨著音頻處理領域的技術發展,對于這樣技術的需要也催生了相應的研究成果。
在面對這類語音和音樂混疊信號的分離的問題時,現在主要是基于基頻分析和頻譜分解算法來進行的。例如,Klapuri等人提出了一種基于音樂頻譜的諧波特性和平滑特性的迭代算法來檢測音樂頻譜中的多個基頻并計算出各基頻對應的諧波分量;Li?通過檢測歌曲音頻信號的主要基頻輪廓,用聚類學習的方法從混疊信號中分離出歌聲信號等等,都取得了不錯的音頻分離效果。
目前,NMF即非負矩陣分解法是很多研究者關注的重點。NMF?的基本原理是將信號分解為基本矩陣和相應的系數矩陣,根據代價函數來計算各個信源成分所對應的基本矩陣和系數矩陣,從而實現信號的分離。根據一直音頻信號的先驗知識獲得的多少,可以將NMF分為盲信號模型,監督模型,和半盲模型,即完全不知道先驗信號成分基本矩陣,知道所有混疊信號成分的基本矩陣,與只知道部分混疊信號成分的基本矩陣。而代價函數的選取主要包括分離前后信號的相似度與根據所處理信號的特性而加入的一些限制條件兩類。因此,目前并沒有非負矩陣分解的音頻分離方法
本發明所需要處理的問題即屬于盲信號模型的NMF信號分離問題;它需要利用分離前后信號的相似度作為代價函數,并輔之以語音音頻與音樂音頻在音頻特征的差異度作為另外的遞歸終止條件。
發明內容
為克服現有技術上的不足,本發明目的是在于提供了一種基于NMF非負矩陣分解的音頻分離方法,其通過利用NMF進行非負矩陣分解,從而將音樂與語音的混雜音頻文件分解成為單純的音樂音頻文件和語音音頻文件,通過對于每次分解后的音頻文件進行特征提取與判別,從而判斷每一次分解的結果是否為音樂文件或者語音文件。
為解決上述問題,本發明采用如下技術方案:一種基于NMF非負矩陣分解的音頻分離方法,包括輔助音樂語音區分模塊和NMF非負矩陣分解模塊,
所述的輔助音樂語音區分模塊主要利用了機器學習的方法,通過提取大量的語音音樂音頻的相關音頻特征作為訓練樣本,通過SVM算法進行訓練得到識別模型;
所述的NMF非負矩陣分解模塊利用NMF非負矩陣分解方法,通過對原音頻信號矩陣進行迭代分解,直到分解結果達到代價函數與輔助區分模塊的要求則停止。
進一步地,所述的輔助音樂語音區分模塊利用機器學習的方法步驟:
a、需要采集大量的語音、音樂以及既非語音也非音樂的音頻文件作為訓練樣本,從而得到相應的區分模型。其中反面樣本的選取可以更好的保證;
b、提取音頻特征中的靜音幀率、高過零率幀比率、低能量幀率、譜通量以及和諧度五個音頻量化特征構成每個音頻的特征向量,作為及其學習訓練的輸入向量集。之所以提取這五個特征,是因為語音音頻與音樂音頻在這五個特征當中有較大的差異,因此利用這五個特征可以有較好的特征提取效果;
c、利用SVM算法對于b中所得到的向量集進行建模,得到所需要的用以識別語音與音樂視頻的識別模型。
進一步地,所述的NMF非負矩陣分解模塊主要有以下幾個方面:
a、首先,我們會得到下面NMF非負矩陣分解的基本依據公式;
b、而后,我們會依據在盲狀態模型構建出符合本發明要求的歐幾里得距離代價函數,即判斷分解結束的主要條件;
c、依據此代價函數與基本函數,我們會得到用以分解原信號矩陣的迭代公式,并依據迭代公式進行迭代分解;
d、當每次迭代完成之后,將利用預先設定的JEuc1門限進行判別,如果達到門限則提取兩個矩陣的相應特征向量,利用之前得到的語音音樂模型進行是否為語音或者音樂的判斷。如果判斷失敗,則繼續利用c中所述方法進行迭代分解,如果判斷成功則在判斷其是否達到門限JEuc2,直到達到該門限時,停止迭代過程。
進一步地,所述的NMF非負矩陣分解的基本依據公式為:
Y=Ys+Ym+V=AsXs+AmXm+V
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海八方視界網絡科技有限公司,未經上海八方視界網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210541700.2/2.html,轉載請聲明來源鉆瓜專利網。





