[發明專利]語音識別的優化方法、裝置、設備以及存儲介質在審
| 申請號: | 202011026486.8 | 申請日: | 2020-09-25 |
| 公開(公告)號: | CN112151022A | 公開(公告)日: | 2020-12-29 |
| 發明(設計)人: | 臧松;張郁枚;胡津 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/18 | 分類號: | G10L15/18;G10L15/28 |
| 代理公司: | 北京市鑄成律師事務所 11313 | 代理人: | 曹遠;閻敏 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 優化 方法 裝置 設備 以及 存儲 介質 | ||
本申請公開了語音識別的優化方法、裝置、設備以及存儲介質,涉及語音技術、智能交通等領域。具體實現方案為:對接收到的語音信息進行識別,得到多個候選識別結果;根據每個候選識別結果的分值,在候選識別結果中確定出目標識別結果;其中,分值是預先確定的;對目標識別結果進行語義解析,得到解析結果;確定解析結果的置信度,根據置信度更新目標識別結果的分值??梢钥朔F有技術中,一旦出現錯誤的語音識別結果便會導致無法解析出正確指令的問題。將語音識別過程和語義解析過程作為一個整體,利用語義解析結果優化語音識別。從而可以提高語音識別的準確性。
技術領域
本申請涉及數據處理領域,尤其涉及語音技術、智能交通等領域。
背景技術
目前語音識別在進行方言識別時,會出現根據發音識別出諧音詞同音詞的情況。在上述識別結果不準確的情況下,會導致語義解析無法解析出真正意圖。
當上述情況發生在自動駕駛的車機交互過程中時,一旦語義解析錯誤,便會導致安全隱患。
發明內容
本申請提供了一種語音識別的優化方法、裝置、設備以及存儲介質。
根據本申請的一方面,提供了一種語音識別的優化方法,可以包括以下步驟:
對接收到的語音信息進行識別,得到多個候選識別結果;
根據每個候選識別結果的分值,在候選識別結果中確定出目標識別結果;其中,分值是預先確定的;
對目標識別結果進行語義解析,得到解析結果;
確定解析結果的置信度,根據置信度更新目標識別結果的分值。
根據本申請的另一方面,提供了一種語音識別的優化裝置,可以包括以下組件:
語音信息識別模塊,用于對接收到的語音信息進行識別,得到多個候選識別結果;
目標識別結果確定模塊,用于根據每個候選識別結果的分值,在候選識別結果中確定出目標識別結果;其中,分值是預先確定的;
語義解析模塊,用于對目標識別結果進行語義解析,得到解析結果;
分值更新模塊,用于確定解析結果的置信度,根據置信度更新目標識別結果的分值。
第三方面,本申請實施例提供一種電子設備,包括:
至少一個處理器;以及
與至少一個處理器通信連接的存儲器;其中,
存儲器存儲有可被至少一個處理器執行的指令,指令被至少一個處理器執行,以使至少一個處理器能夠執行本申請任意一項實施例所提供的方法。
第四方面,本申請實施例提供一種存儲有計算機指令的非瞬時計算機可讀存儲介質,計算機指令用于使計算機執行本申請任意一項實施例所提供的方法。
根據本申請的技術可以克服現有技術中,一旦出現錯誤的語音識別結果便會導致無法解析出正確指令的問題。將語音識別過程和語義解析過程作為一個整體,利用語義解析結果優化語音識別,從而可以提高語音識別的準確性。后續在實際進行語音識別過程中,可以優先選擇分值最高的候選識別結果作為目標識別結果,從而可以降低同音詞的誤識別率。
應當理解,本部分所描述的內容并非旨在標識本申請的實施例的關鍵或重要特征,也不用于限制本申請的范圍。本申請的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本申請的限定。其中:
圖1是根據本申請語音識別的優化方法的流程圖;
圖2是根據本申請確定解析結果的置信度的流程圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011026486.8/2.html,轉載請聲明來源鉆瓜專利網。





