[發明專利]一種語音活動檢測方法及裝置在審
| 申請號: | 201410217411.6 | 申請日: | 2014-05-22 |
| 公開(公告)號: | CN104036777A | 公開(公告)日: | 2014-09-10 |
| 發明(設計)人: | 何勇軍;孫廣路;謝怡寧;鄭云龍 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/0308 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 李迪 |
| 地址: | 150080 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 活動 檢測 方法 裝置 | ||
1.一種語音活動檢測方法,其特征在于,包括:
提取干凈語音信號的信號特征和混噪語音信號的信號特征;
根據所述干凈語音信號的信號特征進行字典訓練得到語音字典;
根據所述混噪語音信號的信號特征動態更新預設的噪聲訓練數據,提取更新后的所述噪聲訓練數據的信號特征進行在線字典訓練得到噪聲字典;
根據所述語音字典和噪聲字典對輸入的混噪語音信號的信號幀進行稀疏表示;
提取所述稀疏表示中的稀疏系數,根據所述稀疏系數對輸入的混噪語音信號的信號幀進行檢測。
2.如權利要求1所述的方法,其特征在于,所述提取干凈語音信號的信號特征和混噪語音信號的信號特征具體包括:
對干凈語音的離散時間信號進行預處理;
將經過預處理的干凈語音信號的信號幀進行離散傅立葉變換得到干凈語音信號的幅度譜,將所述干凈語音信號的幅度譜作為干凈語音信號的信號特征;
對混噪語音的離散時間信號進行預處理;
將經過預處理的混噪語音信號的信號幀進行離散傅立葉變換得到混噪語音信號的幅度譜,將所述混噪語音信號的幅度譜作為混噪語音信號的信號特征。
3.如權利要求2所述的方法,其特征在于,預處理具體包括:對離散時間信號進行分幀,并對分幀處理后的幀信號進行加窗。
4.如權利要求1所述的方法,其特征在于,所述根據干凈語音信號的信號特征進行字典訓練得到語音字典具體包括:
利用K-SVD算法對所述干凈語音信號的信號特征進行字典訓練得到語音字典Φs,計算公式如下所示:
其中,是由M個干凈語音信號的幀組成的訓練用的信號特征,X=[x1,x2,...,xM]是相對于Ys的一組稀疏向量集,T0是訓練語音字典的稀疏的預設限制門限。
5.如權利要求1所述的方法,其特征在于,所述根據混噪語音信號的信號特征動態更新預設的噪聲訓練數據,提取更新后的所述噪聲訓練數據的信號特征進行在線字典訓練得到噪聲字典具體包括:
根據所述混噪語音信號的信號特征進行字典訓練得到混噪字典;
提取預設的噪聲訓練數據的信號特征進行字典訓練得到初始噪聲字典;
根據所述語音字典和初始噪聲字典對所述混噪語音信號進行稀疏表示,從所述混噪語音信號中提取出新的噪聲數據動態更新預設的噪聲訓練數據;
提取更新后的所述噪聲訓練數據的信號特征進行字典訓練更新所述初始噪聲字典,得到噪聲字典。
6.如權利要求1所述的方法,其特征在于,所述根據語音字典和噪聲字典對輸入的混噪語音信號的信號幀進行稀疏表示具體包括:
將所述語音字典和噪聲字典進行字典拼接生成原子字典;
根據所述原子字典利用形態成分分析MCA算法計算輸入的混噪語音信號的信號幀的稀疏系數,所述稀疏系數包括語音字典的稀疏系數和噪聲字典的稀疏系數;
根據所述稀疏系數將輸入的混噪語音信號的信號幀進行稀疏表示。
7.如權利要求6所述的方法,其特征在于,所述提取稀疏表示中的稀疏系數,根據所述稀疏系數對輸入的混噪語音信號的信號幀進行檢測具體包括:
提取所述語音字典的稀疏系數;
將所述語音字典的稀疏系數與預設門限進行比較,當語音字典的稀疏系數中非零元素的個數大于預設門限時,則輸入的混噪語音信號的信號幀為語音信號,否則,所述信號幀為非語音信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410217411.6/1.html,轉載請聲明來源鉆瓜專利網。





