[發明專利]一種語音去混響的方法及裝置有效
| 申請號: | 201711460558.8 | 申請日: | 2017-12-28 |
| 公開(公告)號: | CN109979476B | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 李佳芮;梁民 | 申請(專利權)人: | 電信科學技術研究院 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L25/18 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;安利霞 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 混響 方法 裝置 | ||
1.一種語音去混響的方法,其特征在于,包括:
獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量;
根據所述每幀語音信號的頻譜矢量,分別獲取檢測結果為語音的信號幀的第一頻點以及檢測結果為非語音的信號幀的第二頻點;
獲取所述第一頻點中每一頻點處的頻譜的去混響后的第一語音信號頻譜矢量,并根據所述第一語音信號頻譜矢量對每一頻點的加權預測誤差的預測系數矩陣進行更新;
獲取第二頻點中每一頻點的頻譜進行衰減后的非語音信號頻譜矢量;
根據所述第一語音信號頻譜矢量和非語音信號頻譜矢量,獲取去混響語音信號;
其中,所述根據所述每幀語音信號的頻譜矢量,分別獲取檢測結果為語音的信號幀的第一頻點以及檢測結果為非語音的信號幀的第二頻點的步驟,包括:
獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值和所述香農熵值的方差之比;
獲取當前幀語音信號在預設頻點的頻譜矢量與前一幀語音信號在預設頻點的頻譜矢量間相干系數的幅值平方;
在所述麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值和所述香農熵值的方差之比小于第一門限參數,且所述當前幀語音信號在預設頻點的頻譜矢量與前一幀語音信號在預設頻點的頻譜矢量間相干系數的幅值平方大于第二門限參數時,將當前幀語音信號在預設頻點處標記為語音;或
在所述麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值和所述香農熵值的方差之比大于或等于第一門限參數,或所述當前幀語音信號在預設頻點的頻譜矢量與前一幀語音信號在預設頻點的頻譜矢量的幅值平方相干系數小于或等于第二門限參數時,將當前幀語音信號在預設頻點處標記為噪音。
2.根據權利要求1所述的語音去混響的方法,其特征在于,所述獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量的步驟,包括:
獲取麥克風陣列實時捕獲的語音信號;
對每一幀語音信號進行頻譜計算,得到麥克風陣列捕獲的每幀語音信號的頻譜矢量。
3.根據權利要求1所述的語音去混響的方法,其特征在于,所述獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值和所述香農熵值的方差之比的步驟,包括:
獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值和所述麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值的方差;
根據所述香農熵值和所述香農熵值的方差,獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值和所述香農熵值的方差之比。
4.根據權利要求3所述的語音去混響的方法,其特征在于,所述麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值的獲取方式為:
獲取檢測頻點處的每幀語音信號的頻譜矢量的幅值權重;
根據所述幅值權重,獲取每一個麥克風捕獲的每幀語音信號的頻譜矢量的香農熵值;
根據所述每一個麥克風捕獲的每幀語音信號的頻譜矢量的香農熵值,獲取麥克風陣列捕獲的每幀語音信號的頻譜矢量的香農熵值。
5.根據權利要求4所述的語音去混響的方法,其特征在于,所述獲取檢測頻點處的每幀語音信號的頻譜矢量的幅值權重的步驟,包括:
根據公式:獲取幅值權重;
其中,pn,m[k]為第k幀第m個頻點處的語音信號的頻譜矢量的幅值權重;yn,m[k]為第n個麥克風接收信號的第k幀快速傅氏變換中第m個頻點的譜線;n=1,2,...,N,且N為捕獲語音信號的麥克風總數;m=1,2,...,M,且M為頻點總數;k為信號幀索引變量,k=1,2,...,K,且K為語音信號總幀數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電信科學技術研究院,未經電信科學技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711460558.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:解決回聲消除失效的方法、系統及存儲介質
- 下一篇:人工耳蝸的聲音處理方法





