[發明專利]語音處理方法、裝置、設備及存儲介質有效
| 申請號: | 201810595783.0 | 申請日: | 2018-06-11 |
| 公開(公告)號: | CN108806707B | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 李超;朱唯鑫 | 申請(專利權)人: | 百度在線網絡技術(北京)有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;劉芳 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 處理 方法 裝置 設備 存儲 介質 | ||
本申請提供一種語音處理方法、裝置、設備及存儲介質,包括:獲取N個語音幀中每個語音幀的第一聲學特征,N為大于1的正整數。對N個第一聲學特征采用神經網絡算法,得到第一掩蔽閾值。根據N個語音幀的VAD信息修正第一掩蔽閾值,得到第二掩蔽閾值。根據第二掩蔽閾值對N個第一聲學特征進行處理,得到第二聲學特征。從而提高噪聲抑制效果,并且降低語音損傷。
技術領域
本申請涉及語音處理技術領域,尤其涉及一種語音處理方法、裝置、設備及存儲介質。
背景技術
在低噪聲情況下,人類的聽覺系統可以分辨出嘈雜環境中的感興趣的聲音,這個現象叫做“雞尾酒會效應”。“雞尾酒會效應”通常被在技術上描述為盲源分離問題,也就是在沒有參考信號的情況下,把感興趣的“前景音”從嘈雜的“背景音”中分離出來。
盲源分離主要的技術手段是估計掩蔽閾值(mask),并通過掩蔽閾值對聲學特征進行處理。目前采用神經網絡算法估計掩蔽閾值。例如:針對語音的快速傅里葉變換(FastFourier Transform,FFT)的幅值譜這一特征,通過如下公式估計掩蔽閾值:其中,t表示第t個語音幀,f表示第f個頻點,表示第(t,f)時頻點的干凈(clean)語音的功率;表示第(t,f)時頻點的帶有噪聲(noisy)的語音的功率。然而,在實際應用中干凈語音還是攜帶有噪聲,基于此,造成估計得到的掩蔽閾值不夠準確,進而導致語音處理效果不佳。
發明內容
為了解決上述技術問題,本申請提供一種語音處理方法、裝置、設備及存儲介質,其中根據vad信息對掩蔽閾值修正,從而消除了大量離散的掩蔽閾值,進而提高了噪聲抑制效果,并且降低了語音損傷。
第一方面,本申請提供一種語音處理方法,包括:獲取N個語音幀中每個語音幀的第一聲學特征,N為大于1的正整數。對N個第一聲學特征采用神經網絡算法,得到第一掩蔽閾值。根據N個語音幀的語音活動檢測VAD信息修正第一掩蔽閾值,得到第二掩蔽閾值。根據第二掩蔽閾值對N個第一聲學特征進行處理,得到第二聲學特征。
本申請的有益效果包括:通過vad信息對掩蔽閾值修正,從而消除了大量離散的掩蔽閾值,通過修正后的掩蔽閾值對聲學特征進行處理,可以提高噪聲抑制效果,并且降低語音損傷。
可選地,根據N個語音幀的VAD信息修正第一掩蔽閾值,包括:計算VAD信息與第一掩蔽閾值的乘積,得到第二掩蔽閾值。通過該方法可以有效的修正第一掩蔽閾值。
可選地,VAD信息包括:每個語音幀對應的VAD值。當N個語音幀包括靜音幀時,將靜音幀對應的VAD值置為0。通過該方法可以確定VAD信息,以修正第一掩蔽閾值。
可選地,VAD信息包括:每個語音幀對應的VAD值。相應的,根據N個語音幀的語音活動檢測VAD信息修正第一掩蔽閾值之前,還包括:確定N個語音幀中VAD值為1的M1個語音幀,以及,VAD值為0的P1個語音幀,M1個語音幀與P1個語音幀相鄰,其中M1和P1均為大于1的正整數。對M1個語音幀中的M2個語音幀對應的VAD值和P1個語音幀中的P2個語音幀對應的VAD值作平滑處理,以使M2個語音幀和P2個語音幀對應的VAD值由0漸變至1或者由1漸變至0,M2個語音幀與P2個語音幀相鄰,其中1≤M2≤M1,1≤P2≤P1。通過該方法可以確定VAD信息,以修正第一掩蔽閾值。
可選地,確定N個語音幀中VAD值為1的M1個語音幀,以及,VAD值為0的P1個語音幀,包括:確定N個語音幀中的每個語音幀對應的電話類型,類型包括:靜音和非靜音。將類型為靜音的語音幀確定為VAD值為0的語音幀。將類型為非靜音的語音幀確定為VAD值為1的語音幀。
可選地,M2和P2通過hamming窗、三角窗或者hanning窗確定。
下面將提供一種語音處理裝置、設備、存儲介質及計算機程序產品,其效果和參考上述方法部分的效果,下面對此不再贅述。
第二方面,本申請提供一種語音處理裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于百度在線網絡技術(北京)有限公司,未經百度在線網絡技術(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810595783.0/2.html,轉載請聲明來源鉆瓜專利網。





