[發明專利]語音降噪方法、裝置、存儲介質及計算機設備有效
| 申請號: | 202010245145.3 | 申請日: | 2020-03-31 |
| 公開(公告)號: | CN113470674B | 公開(公告)日: | 2023-06-16 |
| 發明(設計)人: | 祝榕;陳彥宇;馬雅奇;葉盛世;張洋 | 申請(專利權)人: | 珠海格力電器股份有限公司;珠海聯云科技有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L21/0232;G10L25/21 |
| 代理公司: | 北京華夏泰和知識產權代理有限公司 11662 | 代理人: | 曾軍;李雪 |
| 地址: | 519070*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 方法 裝置 存儲 介質 計算機 設備 | ||
本申請涉及一種語音降噪方法、裝置、存儲介質及計算機設備,該方法包括:獲取帶噪語音信號的功率譜,得到第一功率譜;獲取第一功率譜中每個頻點的語音存在概率;根據第一功率譜中每個頻點的語音存在概率,確定疑似噪聲,對疑似噪聲所對應的頻點進行時頻平滑,得到第二功率譜;獲取第二功率譜中每個頻點的語音存在概率;根據第二功率譜中每個頻點的語音存在概率,獲取第二功率譜中每個頻點的平滑因子;根據每個頻點的平滑因子確定每個頻點的噪聲估計值;根據每個頻點的噪聲估計值,對帶噪語音信號中對應頻點進行噪聲濾除。通過本申請實現了準確、快速地估計噪聲并進行濾除,降噪效果顯著提高,且降低了去噪的復雜度,提高了降噪效率。
技術領域
本申請涉及語音識別技術領域,尤其涉及一種語音降噪方法、裝置、存儲介質及計算機設備。
背景技術
隨著人工智能的不斷發展,使用遙控器和機械按鍵等傳統控制方式的家電已經逐漸被語音識別的智能家電所替代。在語音識別家電中最核心的技術就是對語音信號中的噪音進行濾除。智能家電通過語音模塊采集的語音信號中包括穩態噪聲和非穩態噪聲,穩態噪聲相對容易去除,而非穩態噪聲則較難去除,而家電環境中的噪聲大多為非穩態噪聲,因此非穩態噪聲大大影響語音模塊的識別率。
現有技術一部分是通過訓練音頻神經網絡,將混音信號送入音頻神經網絡后,針對不同的噪音進行多維的標記,然后將標記訓練好的人工神經網絡作為濾波器以濾除噪聲。這種方法需要大量的語料對音頻神經網絡進行訓練,而且運算量大,時效性低、去噪效果也不佳。另一部分則是通過噪聲估計和譜增益估計結合的方法來實現對于語音的降噪,但是在噪聲估計中存在延遲的缺陷,對波動較大的信號估計誤差比較大,因此噪聲去除效果不佳。
發明內容
為了解決現有技術中運算量大導致時效性低、去噪效果不佳,以及由于存在延遲導致噪聲估計誤差較大進而導致去噪效果不佳的技術問題,本申請實施例提供了一種語音降噪方法、裝置、存儲介質及計算機設備。
第一方面,本申請實施例提供了一種語音降噪方法,該方法包括:
獲取帶噪語音信號;
獲取帶噪語音信號的功率譜,得到第一功率譜;
獲取第一功率譜中每個頻點的語音存在概率;
根據第一功率譜中每個頻點的語音存在概率,確定疑似噪聲,對第一功率譜中疑似噪聲所對應的頻點進行時頻平滑,得到第二功率譜;
獲取第二功率譜中每個頻點的語音存在概率;
根據第二功率譜中每個頻點的語音存在概率,獲取第二功率譜中每個頻點的平滑因子;
根據第二功率譜中每個頻點的平滑因子確定第一功率譜中每個頻點的噪聲估計值;
根據第一功率譜中每個頻點的噪聲估計值,對帶噪語音信號中對應頻點進行噪聲濾除。
可選地,在獲取帶噪語音信號之前,該方法還包括:
對采集到的聲源數據進行數字化處理,得到帶噪語音信號;
獲取帶噪語音信號的功率譜,得到第一功率譜,包括:
對帶噪語音信號進行頻域變換,得到帶噪語音信號的頻域信號,
根據帶噪語音信號的頻域信號得到帶噪語音信號對應的第一功率譜。
可選地,獲取第一功率譜中每個頻點的語音存在概率,包括:
對第一功率譜進行分幀處理,其中,每一幀包含多個頻點;
對第一功率譜中每個頻點進行平滑處理;
對平滑處理后的第一功率譜從第一幀開始至最后一幀逐幀進行最小值跟蹤得到第一功率譜的最小值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海格力電器股份有限公司;珠海聯云科技有限公司,未經珠海格力電器股份有限公司;珠海聯云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010245145.3/2.html,轉載請聲明來源鉆瓜專利網。





