[發明專利]一種語音處理方法及電子設備有效
| 申請號: | 201410488490.4 | 申請日: | 2014-09-22 |
| 公開(公告)號: | CN104269177B | 公開(公告)日: | 2017-11-07 |
| 發明(設計)人: | 齊峰巖 | 申請(專利權)人: | 聯想(北京)有限公司 |
| 主分類號: | G10L21/02 | 分類號: | G10L21/02;G10L15/02 |
| 代理公司: | 北京金信知識產權代理有限公司11225 | 代理人: | 黃威,王智 |
| 地址: | 100085 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 處理 方法 電子設備 | ||
技術領域
本發明涉及電子技術領域,尤其涉及一種語音處理方法及電子設備。
背景技術
隨著電子技術的飛速發展,人們的生活和網絡及各種功能各異的電子產品越加緊密的聯系在一起,現今的智能手機用戶對語音通話質量要求越來越高,各大平臺廠商和第三方供應商都在提升通話質量方面推出很多解決方案,而手機通信廠商則最看重的是下行語音質量,這可以提升用戶的品牌認知,而下行通話質量主要受到單通道語音降噪以及外放手機揚聲器限制的影響。在單通道下行降噪一般沒有其它的參考,需要通過聲音活動偵查(voice activity detection,VAD)識別出噪聲段,通過噪聲估計算法形成降噪參考,在各種噪聲環境中測試發現在降噪的同時很容易損傷語音,造成斷續和降質,而放在移動設備上揚聲器的尺寸很小,低頻表現力較差。
本申請發明人在實現本申請實施例中技術方案的過程中,發現現有技術存在如下技術問題:
現有技術中的下行語音噪聲抑制的方法為:電子設備接收到下行語音數據后,對語音數據進行解碼;然后對解碼數據進行增益放大處理,然后將放大處理的后語音數據通過高通濾波器;將高通濾波器輸出的數據分兩路進行處理:其中第一路通過聲音活動偵查(voice activity detection,VAD)識別出噪聲段,通過噪聲估計算法形成降噪參考;第二路通過信噪比評估,確定降噪處理的幅度。然后根據降噪參考和信噪比評估之后的降噪幅度等參數進行噪聲抑制處理得到最終的語音數據。
上述現有技術的語音噪聲抑制方法在不同的非穩態噪聲環境中,電子設備的噪聲抑制性能不穩定,語音會發生斷續和音質下降,尤其是在嘈雜人聲的環境中,噪聲抑制性能很差。
發明內容
本發明提供一種語音處理方法及電子設備,本發明所提供的方法和裝置解決現有技術所提供的語音噪聲抑制方法在不同的非穩態噪聲環境中,電子設備的噪聲抑制性能不穩定,語音會發生斷續和音質下降的問題。
本發明提供一種語音處理方法,該方法應用于一電子設備中,該方法包括:
電子設備接收到下行語音數據后,提取所述下行語音數據的第一特征參數;
對所述下行語音數據進行下行降噪處理,得到第一語音數據,并提取所述第一語音數據的第二特征參數;
根據所述第一特征參數、所述第二特征參數和預設的增強算法對所述第一語音數據進行增強處理,得到第二語音數據;其中,所述第二語音數據的可懂度大于所述接收到的下行語音數據的可懂度;
輸出所述第二語音數據。
可選的,根據所述第一特征參數、所述第二特征參數和預設的增強算法對所述第一語音數據進行增強處理,得到第二語音數據包括:
根據所述第一特征參數和第二特征參數確定進行平滑處理的第三特征參數,利用所述第三特征參數對所述第一語音數據進行平滑處理,得到第二語音數據。
可選的,根據所述第一特征參數、所述第二特征參數和預設的增強算法對所述第一語音數據進行增強處理,得到第二語音數據包括:
根據所述第一特征參數和第二特征參數對所述第一語音數據中的低頻分量進行加強,得到所述第二語音數據。
可選的,根據所述第一特征參數、所述第二特征參數和預設的增強算法對所述第一語音數據進行增強處理之后,還進一步包括:
獲取電子設備中揚聲器的揚聲器特性參數;
根據所述揚聲器特性參數對第二語音數據進行增強處理。
可選的,根據所述揚聲器特性參數對第二語音數據進行增強處理包括:
從所述揚聲器特性參數中獲取諧波失真THD,根據所述THD對所述第二語音數據中的設定頻段進行增強處理。
可選的,所述第一特征參數和所述第二特征參數都至少包括語音數據的基音周期、線性預測系數和能量參數中的至少一項或多項的組合。
針對上述方法,本發明還提一種電子設備,該電子設備包括:
第一特征提取單元,用于在接收到下行語音數據后,提取所述下行語音數據的第一特征參數;
第二特征提取單元,用于對所述下行語音數據進行下行降噪處理,得到第一語音數據,并提取所述第一語音數據的第二特征參數;
第一增強單元,用于根據所述第一特征參數、所述第二特征參數和預設的增強算法對所述第一語音數據進行增強處理,得到第二語音數據;其中,所述第二語音數據的可懂度大于所述接收到的下行語音數據的可懂度;
輸出單元,用于輸出所述第二語音數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于聯想(北京)有限公司,未經聯想(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410488490.4/2.html,轉載請聲明來源鉆瓜專利網。





