[發明專利]一種語音特征處理方法、裝置、電子設備及存儲介質有效

申請號：	202110290322.4	申請日：	2021-03-18
公開（公告）號：	CN112735397B	公開（公告）日：	2021-07-23
發明（設計）人：	谷悅;楊嵩;王莎	申請（專利權）人：	北京世紀好未來教育科技有限公司
主分類號：	G10L15/20	分類號：	G10L15/20;G10L21/0208
代理公司：	上海知錦知識產權代理事務所(特殊普通合伙) 31327	代理人：	王立娜
地址：	100144 北京市海淀區中***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種語音特征處理方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例提供一種語音特征處理方法、裝置、電子設備及存儲介質，其中方法包括：從帶噪語音的語音特征中去除噪音的語音特征，得到純凈語音特征估計；對所述純凈語音特征估計進行編碼處理，得到第一語音特征編碼信息，以及對所述帶噪語音的語音特征進行編碼處理，得到第二語音特征編碼信息；根據所述第一語音特征編碼信息以及所述第二語音特征編碼信息，得到用于解碼的目標語音特征編碼信息。本申請實施例可針對帶噪語音，準確的形成語音特征編碼信息，為提升語音識別的準確性提供基礎。

技術領域

本申請實施例涉及語音識別技術領域，具體涉及一種語音特征處理方法、裝置、電子設備及存儲介質。

背景技術

語音識別是一種將語音轉換為文本的技術，其在人機的語音交互、智能控制、通訊等場景下具有廣泛應用，因此提升語音識別的準確性具有重要意義。

在進行語音識別時，需要對待識別語音對應的語音特征進行編碼處理，形成深層的語音特征編碼信息，進而對語音特征編碼信息進行解碼等進一步處理，實現文本轉換；然而在語音識別的實際應用場景中，待識別語音除了說話者本身的純凈語音外還可能存在噪音，即待識別語音為帶噪語音，這使得從帶噪語音中提取的語音特征存在噪音的語音特征，導致后續處理形成的語音特征編碼信息也相應存在噪音的編碼信息，極大的影響了語音識別的準確性，降低了語音識別服務的用戶體驗；

因此，針對待識別的帶噪語音，如何提供語音特征處理方案，以準確的形成語音特征編碼信息，為提升語音識別的準確性提供基礎，成為了本領域技術人員亟需解決的問題。

發明內容

有鑒于此，本申請實施例提供一種語音特征處理方法、裝置、電子設備及存儲介質，以針對帶噪語音，準確的形成語音特征編碼信息，為提升語音識別的準確性提供基礎。

為實現上述目的，本申請實施例提供如下技術方案：

一種語音特征處理方法，包括：

從帶噪語音的語音特征中去除噪音的語音特征，得到純凈語音特征估計；

對所述純凈語音特征估計進行編碼處理，得到第一語音特征編碼信息，以及對所述帶噪語音的語音特征進行編碼處理，得到第二語音特征編碼信息；

根據所述第一語音特征編碼信息以及所述第二語音特征編碼信息，得到用于解碼的目標語音特征編碼信息。

本申請實施例還提供一種語音特征處理裝置，包括：

噪音去除模塊，用于從帶噪語音的語音特征中去除噪音的語音特征，得到純凈語音特征估計；

編碼處理模塊，用于對所述純凈語音特征估計進行編碼處理，得到第一語音特征編碼信息，以及對所述帶噪語音的語音特征進行編碼處理，得到第二語音特征編碼信息；

目標編碼信息得到模塊，用于根據所述第一語音特征編碼信息以及所述第二語音特征編碼信息，得到用于解碼的目標語音特征編碼信息。