[發明專利]一種語音特征處理方法、裝置、電子設備及存儲介質有效
| 申請號: | 202110290322.4 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN112735397B | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 谷悅;楊嵩;王莎 | 申請(專利權)人: | 北京世紀好未來教育科技有限公司 |
| 主分類號: | G10L15/20 | 分類號: | G10L15/20;G10L21/0208 |
| 代理公司: | 上海知錦知識產權代理事務所(特殊普通合伙) 31327 | 代理人: | 王立娜 |
| 地址: | 100144 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 特征 處理 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供一種語音特征處理方法、裝置、電子設備及存儲介質,其中方法包括:從帶噪語音的語音特征中去除噪音的語音特征,得到純凈語音特征估計;對所述純凈語音特征估計進行編碼處理,得到第一語音特征編碼信息,以及對所述帶噪語音的語音特征進行編碼處理,得到第二語音特征編碼信息;根據所述第一語音特征編碼信息以及所述第二語音特征編碼信息,得到用于解碼的目標語音特征編碼信息。本申請實施例可針對帶噪語音,準確的形成語音特征編碼信息,為提升語音識別的準確性提供基礎。
技術領域
本申請實施例涉及語音識別技術領域,具體涉及一種語音特征處理方法、裝置、電子設備及存儲介質。
背景技術
語音識別是一種將語音轉換為文本的技術,其在人機的語音交互、智能控制、通訊等場景下具有廣泛應用,因此提升語音識別的準確性具有重要意義。
在進行語音識別時,需要對待識別語音對應的語音特征進行編碼處理,形成深層的語音特征編碼信息,進而對語音特征編碼信息進行解碼等進一步處理,實現文本轉換;然而在語音識別的實際應用場景中,待識別語音除了說話者本身的純凈語音外還可能存在噪音,即待識別語音為帶噪語音,這使得從帶噪語音中提取的語音特征存在噪音的語音特征,導致后續處理形成的語音特征編碼信息也相應存在噪音的編碼信息,極大的影響了語音識別的準確性,降低了語音識別服務的用戶體驗;
因此,針對待識別的帶噪語音,如何提供語音特征處理方案,以準確的形成語音特征編碼信息,為提升語音識別的準確性提供基礎,成為了本領域技術人員亟需解決的問題。
發明內容
有鑒于此,本申請實施例提供一種語音特征處理方法、裝置、電子設備及存儲介質,以針對帶噪語音,準確的形成語音特征編碼信息,為提升語音識別的準確性提供基礎。
為實現上述目的,本申請實施例提供如下技術方案:
一種語音特征處理方法,包括:
從帶噪語音的語音特征中去除噪音的語音特征,得到純凈語音特征估計;
對所述純凈語音特征估計進行編碼處理,得到第一語音特征編碼信息,以及對所述帶噪語音的語音特征進行編碼處理,得到第二語音特征編碼信息;
根據所述第一語音特征編碼信息以及所述第二語音特征編碼信息,得到用于解碼的目標語音特征編碼信息。
本申請實施例還提供一種語音特征處理裝置,包括:
噪音去除模塊,用于從帶噪語音的語音特征中去除噪音的語音特征,得到純凈語音特征估計;
編碼處理模塊,用于對所述純凈語音特征估計進行編碼處理,得到第一語音特征編碼信息,以及對所述帶噪語音的語音特征進行編碼處理,得到第二語音特征編碼信息;
目標編碼信息得到模塊,用于根據所述第一語音特征編碼信息以及所述第二語音特征編碼信息,得到用于解碼的目標語音特征編碼信息。
本申請實施例還提供一種電子設備,包括至少一個存儲器和至少一個處理器,所述存儲器存儲一條或多條計算機可執行指令,所述處理器調用所述一條或多條計算機可執行指令,以執行實現如上述所述的語音特征處理方法。
本申請實施例還提供一種存儲介質,所述存儲介質存儲一條或多條計算機可執行指令,所述一條或多條計算機可執行指令被執行時實現如上述所述的語音特征處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京世紀好未來教育科技有限公司,未經北京世紀好未來教育科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110290322.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鬼臼毒素在煙草抑芽中的應用
- 下一篇:燃氣灶自動定時熄火裝置及保護方法





