[發明專利]語音識別的方法、裝置、電子設備和可讀存儲介質在審
| 申請號: | 202110522510.5 | 申請日: | 2021-05-13 |
| 公開(公告)號: | CN113327602A | 公開(公告)日: | 2021-08-31 |
| 發明(設計)人: | 郭啟行;崔亞峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/16 | 分類號: | G10L15/16;G10L15/30;H04L12/26 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 電子設備 可讀 存儲 介質 | ||
本公開提供了一種語音識別的方法、裝置、電子設備和可讀存儲介質,涉及深度學習與語音處理技術領域。其中,語音識別的方法包括:獲取終端設備與服務器端進行數據傳輸時的網絡數據;根據所述網絡數據得到至少一種網絡特征;將所述至少一種網絡特征輸入預先訓練得到的預測模型,得到所述預測模型輸出的預測結果;在確定所述預測結果滿足預設要求的情況下,將所述終端設備的識別方式切換為離線識別以進行語音識別。本公開能夠提升終端設備在進行語音識別時切換識別方式的準確性。
技術領域
本公開涉及數據處理技術領域,尤其涉及深度學習與語音處理技術領域。提供了一種語音識別的方法、裝置、電子設備和可讀存儲介質。
背景技術
語音識別通常分為在線識別和離線識別兩種識別方式。在實際使用場景中,尤其是終端設備的語音識別的應用,大部分使用在線識別的識別方式。但當終端設備沒有網絡或者網絡比較差時,會導致在線識別失敗或者延遲較大的技術問題。如果僅使用離線識別,由于離線識別的模型會有大小的限制,并且離線引擎的更新頻率非常低,會導致識別效果較差的問題,另外離線識別會消耗終端設備更大的計算資源。
發明內容
根據本公開的第一方面,提供了一種語音識別的方法,包括:獲取終端設備與服務器端進行數據傳輸時的網絡數據;根據所述網絡數據得到至少一種網絡特征;將所述至少一種網絡特征輸入預先訓練得到的預測模型,得到所述預測模型輸出的預測結果;在確定所述預測結果滿足預設要求的情況下,將所述終端設備的識別方式切換為離線識別以進行語音識別。
根據本公開的第二方面,提供了一種語音識別的裝置,包括:獲取單元,用于獲取終端設備與服務器端進行數據傳輸時的網絡數據;處理單元,用于根據所述網絡數據得到至少一種網絡特征;預測單元,用于將所述至少一種網絡特征輸入預先訓練得到的預測模型,得到所述預測模型輸出的預測結果;切換單元,用于在確定所述預測結果滿足預設要求的情況下,將所述終端設備的識別方式切換為離線識別以進行語音識別。
根據本公開的第三方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如上所述的方法。
根據本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行如上所述的方法。
根據本公開的第五方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現如上所述的方法。
由以上技術方案可以看出,本實施例在通過獲取的網絡數據得到至少一種網絡特征之后,將至少一種網絡特征作為預測模型的輸入,根據預測模型輸出的預測結果,確定是否將終端設備的識別方式由在線識別切換為離線識別,從而提升了終端設備在切換識別方式時的準確性,實現了兩種識別方式的相互配合,在確保能夠完成語音識別的同時,降低了終端設備的資源消耗。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1是根據本公開第一實施例的示意圖;
圖2是根據本公開第二實施例的示意圖;
圖3是用來實現本公開實施例的語音識別的方法的電子設備的框圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110522510.5/2.html,轉載請聲明來源鉆瓜專利網。





