[發明專利]語音識別方法、裝置、設備和存儲介質有效
| 申請號: | 202110455740.4 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113223522B | 公開(公告)日: | 2022-05-03 |
| 發明(設計)人: | 趙銀樓;張遼;蔣正翔 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/14;G10L15/16;G10L15/183;G10L15/26;G10L15/30 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 存儲 介質 | ||
本公開公開了一種語音識別方法、裝置、設備和存儲介質,涉及計算機技術領域,具體涉及語音識別、深度學習等技術領域。語音識別方法包括:獲取輸入信息,所述輸入信息包括:語音信息和當前地域信息;基于所述語音信息獲得待識別的識別內容;采用所述當前地域信息對應的地域語言模型對所述識別內容進行處理,以獲得所述語音信息對應的文本內容。本公開可以提高語音識別的精準度。
技術領域
本公開涉及計算機技術領域,具體涉及語音識別、深度學習等技術領域,尤其涉及一種語音識別方法、裝置、設備和存儲介質。
背景技術
隨著科技的發展,語音識別技術逐漸應用到各行各業。地圖應用中對地址的識別是語音識別技術的一個重要應用場景。在地圖應用中可能會存在同音但不同地址的問題,比如,北京的“靈境胡同”與沈陽的“玲靖胡同”,二者發音相同,但實際代表的地址不同。
相關技術中,語音識別時,僅依據語音信息進行語音識別,輸出同音的多個文本內容作為候選結果,比如上述的“靈境胡同”和“玲靖胡同”作為候選結果,由用戶在多個候選結果中進行人工選擇。
發明內容
本公開提供了一種語音識別方法、裝置、設備和存儲介質。
根據本公開的一方面,提供了一種語音識別方法,包括:獲取輸入信息,所述輸入信息包括:語音信息和當前地域信息;基于所述語音信息獲得待識別的識別內容;采用所述當前地域信息對應的地域語言模型對所述識別內容進行處理,以獲得所述語音信息對應的文本內容。
根據本公開的另一方面,提供了一種語音識別裝置,包括:獲取模塊,用于獲取輸入信息,所述輸入信息包括:語音信息和當前地域信息;識別模塊,用于基于所述語音信息獲得待識別的識別內容;第一處理模塊,用于采用所述當前地域信息對應的地域語言模型對所述識別內容進行處理,以獲得所述語音信息對應的文本內容。
根據本公開的另一方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行如上述任一方面的任一項所述的方法。
根據本公開的另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行根據上述任一方面的任一項所述的方法。
根據本公開的另一方面,提供了一種計算機程序產品,包括計算機程序,所述計算機程序在被處理器執行時實現根據上述任一方面的任一項所述的方法。
根據本公開的技術方案,可以提高語音識別的精準度。
應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
附圖說明
附圖用于更好地理解本方案,不構成對本公開的限定。其中:
圖1是根據本公開第一實施例的示意圖;
圖2是根據本公開第二實施例的示意圖;
圖3是根據本公開第三實施例的示意圖;
圖4是根據本公開第四實施例的示意圖;
圖5是根據本公開第五實施例的示意圖;
圖6是根據本公開第六實施例的示意圖;
圖7是用來實現本公開實施例的語音識別方法中任一方法的電子設備的示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110455740.4/2.html,轉載請聲明來源鉆瓜專利網。





