[發(fā)明專利]一種基于改進(jìn)的并行模型組合的聲音事件識(shí)別方法有效
| 申請?zhí)枺?/td> | 201310239724.7 | 申請日: | 2013-06-17 |
| 公開(公告)號: | CN103310789A | 公開(公告)日: | 2013-09-18 |
| 發(fā)明(設(shè)計(jì))人: | 劉宏;王一;李曉飛 | 申請(專利權(quán))人: | 北京大學(xué)深圳研究生院 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/02 |
| 代理公司: | 北京君尚知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11200 | 代理人: | 余長江 |
| 地址: | 518055 廣東省深*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 改進(jìn) 并行 模型 組合 聲音 事件 識(shí)別 方法 | ||
1.一種基于改進(jìn)的并行模型組合的聲音事件識(shí)別方法,其步驟包括:
1)根據(jù)干凈聲音事件訓(xùn)練得到GMM高斯混合模型,建立干凈聲音事件模板;
2)根據(jù)噪聲數(shù)據(jù)訓(xùn)練得到GMM高斯混合模型,建立噪聲模板;
3)對所述噪聲模板和所述干凈聲音事件模板采用并行模型融合的方法,得到帶噪聲音事件模板;
4)采樣得到帶噪聲音事件樣本信號,根據(jù)所述帶噪聲音事件模板中的參數(shù)對樣本信號進(jìn)行聲音識(shí)別。
2.如權(quán)利要求1所述的基于改進(jìn)的并行模型組合的聲音事件識(shí)別方法,其特征在于,建立干凈聲音事件的模板的方法如下:
1)在無噪安靜室內(nèi)的環(huán)境下錄制聲音事件的數(shù)據(jù),對錄制的聲音事件進(jìn)行預(yù)濾波、模數(shù)變換后再進(jìn)行分幀、加窗處理;
2)提取MFCC梅爾倒譜系數(shù)特征,訓(xùn)練出聲音事件的GMM高斯混合模板。
3.如權(quán)利要求1所述的基于改進(jìn)的并行模型組合的聲音事件識(shí)別方法,其特征在于,所述高斯混合模型采用EM算法訓(xùn)練并更新高斯模型的參數(shù),訓(xùn)練得到的干凈聲音事件的GMM參數(shù)為λx={wxk,μxk,Σxk},k=1,2···,M,其中,wxk表示干凈聲音事件模型的混合權(quán)重,μxk表示干凈聲音事件模型的均值,Σxk表示干凈聲音事件模型的方差,M表示混合高斯的階數(shù)。
4.如權(quán)利要求1所述的基于改進(jìn)的并行模型組合的聲音事件識(shí)別方法,其特征在于,在室內(nèi)真實(shí)有噪聲的環(huán)境下獲取當(dāng)前環(huán)境中的噪聲數(shù)據(jù),建立所述噪聲模板方法為:提取MFCC特征,建立噪聲的GMM模板,得到噪聲模板GMM參數(shù)為λn={wnk,μnk,Σnk},k=1,2···,M,其中,wnk表示噪聲模型的混合權(quán)重,μnk表示噪聲模型的均值,Σnk表示噪聲模型的方差,M表示混合高斯的階數(shù)。
5.如權(quán)利要求1所述的基于改進(jìn)的并行模型組合的聲音事件識(shí)別方法,其特征在于,對所述噪聲模板和所述干凈聲音事件模板采用并行模型融合的方法如下:
(1)采用離散余弦逆變換將任一模型參數(shù)由倒譜域映射到線性譜域,得到對數(shù)譜域模型的均值μlog=C-1μ和方差Σlog=C-1Σ(C-1)T,其中,C為離散余弦變換矩陣,μ,Σ分別為模型的倒譜域的均值和方差;
(2)將對數(shù)譜域模型中的對數(shù)譜域均值和方差通過指數(shù)函數(shù)變換到線性譜域,
(3)采用改進(jìn)的并行模型組合方法,將干凈聲音事件模型參數(shù)與噪聲模型參數(shù)在線性譜域進(jìn)行融合,為融合后的帶噪聲音事件模型在線性譜域的均值,為融合后的帶噪聲音事件模型在線性譜域的方差,其中μxklin為干凈聲音事件模型經(jīng)所述步驟(1)(2)變換后的線性譜域的均值,為干凈聲音事件模型經(jīng)所述步驟(1)(2)變換后的線性譜域的方差,μnklin為噪聲模型經(jīng)所述步驟(1)(2)變換后的線性譜域的均值,為噪聲模型經(jīng)所述步驟(1)(2)變換后的線性譜域的方差;
(4)將融合后的帶噪聲音事件模型的線性譜域模型的均值和方差經(jīng)過上述步驟(2)的逆變換得到對數(shù)譜域參數(shù),再經(jīng)過上述步驟(1)逆變換得到倒譜域的特征參數(shù),得到帶噪聲音事件模型的均值向量和方差。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京大學(xué)深圳研究生院,未經(jīng)北京大學(xué)深圳研究生院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310239724.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 簡單網(wǎng)絡(luò)管理協(xié)議設(shè)備的數(shù)據(jù)并行采集歸并方法及系統(tǒng)
- 減少EMI的并行數(shù)據(jù)傳輸方法
- 一種多媒體數(shù)據(jù)并行處理系統(tǒng)及方法
- 一種高速并行OQPSK解調(diào)時(shí)鐘的恢復(fù)系統(tǒng)
- 一種海量地震數(shù)據(jù)并行抽道集方法
- 3G協(xié)議的turbo碼并行譯碼方法及裝置
- 并行擴(kuò)展輸入輸出的教學(xué)裝置
- 數(shù)據(jù)的并行處理
- 并行式插件機(jī)
- 一種SPI總線與并行總線的橋接方法、設(shè)備、系統(tǒng)及介質(zhì)





