[發(fā)明專利]語音增強方法及系統(tǒng)、通話設備有效
| 申請?zhí)枺?/td> | 201910769922.1 | 申請日: | 2019-08-20 |
| 公開(公告)號: | CN110364175B | 公開(公告)日: | 2022-02-18 |
| 發(fā)明(設計)人: | 劉志;周玉軍 | 申請(專利權)人: | 北京凌聲芯語音科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0272;G10L21/0216;G10L21/0224;G10L21/0232 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 董文倩 |
| 地址: | 100086 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 增強 方法 系統(tǒng) 通話 設備 | ||
1.一種語音增強方法,其特征在于,包括:
獲取語音輸入信號;
對所述語音輸入信號進行時頻補償;
計算經過時頻補償的多個語音特征信息,并對所述語音輸入信號進行分類得到語音分類結果;
根據所述多個語音特征信息和語音分類結果,確定語音掩蔽值;
根據所述多個語音特征信息和語音分類結果,確定語音掩蔽值的步驟,包括根據所述多個語音特征信息和預設掩蔽門限值,得到第一掩蔽值;在得到頻域信號零和頻域信號一后,采用分頻帶譜減法得到第二掩蔽值;基于所述語音分類結果,確定第三掩蔽值;在確定所述語音分類結果為噪聲信號時,則確定語音掩蔽值為第三掩蔽值;在確定所述語音分類結果為語音信號時,則比較所述第一掩蔽值和第二掩蔽值,并基于比較結果確定語音掩蔽值;
基于所述語音掩蔽值,確定語音輸出信號;
對所述語音輸入信號進行時頻補償的步驟,包括:分別獲取所述語音輸入信號中第一麥克風的時域信號零和第二麥克風的時域信號一;對所述時域信號零進行分幀處理得到頻域信號零,和,對所述時域信號一進行分幀處理得到頻域信號一,其中,所述頻域信號零和所述頻域信號一包含有多個時頻單元,每個所述時頻單元對應一幀頻域信號的一個頻帶;確定與所述頻域信號一中的每個時頻單元對應的時頻補償參數一;基于所述時頻補償參數一對所述頻域信號一中的各個所述時頻單元進行時頻補償。
2.根據權利要求1所述的方法,其特征在于,計算經過時頻補償的多個語音特征信息的步驟,包括:
計算經過時頻補償的雙通道時間差ITD和雙通道能量差IID;
將所述雙通道時間差ITD和所述雙通道能量差IID確定為所述語音輸入信號的多個語音特征信息。
3.根據權利要求1所述的方法,其特征在于,在計算經過時頻補償的多個語音特征信息之后,所述方法還包括:
判斷所述頻域信號零的目標幀是否為噪聲信號;
在所述頻域信號零的目標幀為噪聲信號時,確定語音分類結果為噪聲信號;或者,
在所述頻域信號零的目標幀不是噪聲信號時,確定語音分類結果為語音信號。
4.根據權利要求3所述的方法,其特征在于,在確定語音分類結果為噪聲信號之后,所述方法還包括:基于所述頻域信號零和所述頻域信號一的信號差值更新所述時頻補償參數一。
5.根據權利要求1所述的方法,其特征在于,基于所述語音掩蔽值,確定語音輸出信號的步驟,包括:
對所述語音掩蔽值進行平滑處理;
基于平滑處理后的所述語音掩蔽值和經過分幀處理后得到的所述頻域信號零,重建語音信號;
將重建后的語音信號確定為所述語音輸出信號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京凌聲芯語音科技有限公司,未經北京凌聲芯語音科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910769922.1/1.html,轉載請聲明來源鉆瓜專利網。





