[發明專利]一種語音識別方法及電子設備在審
| 申請號: | 202010127045.0 | 申請日: | 2020-02-28 |
| 公開(公告)號: | CN111145734A | 公開(公告)日: | 2020-05-12 |
| 發明(設計)人: | 盧露露;馮大航;常樂 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L15/183 | 分類號: | G10L15/183;G10L15/22 |
| 代理公司: | 北京銀龍知識產權代理有限公司 11243 | 代理人: | 許靜;黃燦 |
| 地址: | 100098 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 語音 識別 方法 電子設備 | ||
本發明提供一種語音識別方法及電子設備,該方法包括:獲取待識別語音;根據待識別語音,獲取待識別發音序列;根據對句式進行識別的句式語言模型和所述待識別發音序列中的槽位標識對應的槽位語言模型,對所述待識別發音序列進行識別,獲得識別結果。語言模型同時包括句式語言模型和槽位語言模型,通過句式語言模型對待識別發音序列的句式進行識別,通過槽位語言模型對槽位標識對應的發音子序列進行識別,可提高識別準確率。
技術領域
本發明涉及人工智能技術領域,尤其涉及一種語音識別方法及電子設備。
背景技術
近年來,語音識別技術發展迅速,逐漸從實驗室走向市場,形成產品。在信息處理、通信與電子系統、自動控制等領域相繼出現了不同用途的語音識別系統,已經逐漸顯露出其強大的技術優勢和生命力。
現在,越來越多的語音識別技術被帶入到人們的工作生活中,在信息處理、教育與商務、工業控制等方面,語音識別已經顯露出巨大的優勢。語言模型在語音識別中具有重要的作用,語言模型的作用可以簡單的理解為解決多音字的問題,在聲學模型給出發音序列之后,根據語言模型找出概率最大的字符串序列,并將該字符串序列作為語音識別的識別結果。
現有的語音識別技術,在有限的計算資源和存儲空間的條件下,泛化能力較差,識別準確率較低。通過文本擴充提高模型泛化、支持多種說法的做法,會造成模型過大同時會給模型的訓練過程帶來很大的困難。
發明內容
本發明實施例提供一種語音識別方法及電子設備,以解決現有的語音識別技術識別準確率較低的問題。
為解決上述技術問題,本發明是這樣實現的:
第一方面,本發明實施例提供了一種語音識別方法,應用于電子設備,包括:
獲取待識別語音;
根據待識別語音,獲取待識別發音序列;
根據對句式進行識別的句式語言模型和所述待識別發音序列中的槽位標識對應的槽位語言模型,對所述待識別發音序列進行識別,獲得識別結果。
第二方面,本發明實施例還提供一種電子設備,包括:
第一獲取模塊,用于獲取待識別語音;
第二獲取模塊,用于根據待識別語音,獲取待識別發音序列;
識別模塊,用于根據對句式進行識別的句式語言模型和所述待識別發音序列中的槽位標識對應的槽位語言模型,對所述待識別發音序列進行識別,獲得識別結果。
第三方面,本發明實施例還提供一種電子設備,包括處理器、存儲器及存儲在所述存儲器上并可在所述處理器上運行的計算機程序,所述計算機程序被所述處理器執行時實現上述語音識別方法的步驟。
第四方面,本發明實施例還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器執行時實現上述語音識別方法的步驟。
在本發明實施例中,根獲取待識別語音;根據待識別語音,獲取待識別發音序列;根據對句式進行識別的句式語言模型和所述待識別發音序列中的槽位標識對應的槽位語言模型,對所述待識別發音序列進行識別,獲得識別結果。語言模型同時包括句式語言模型和槽位語言模型,通過句式語言模型對待識別發音序列的句式進行識別,通過槽位語言模型對槽位標識對應的發音子序列進行識別,可提高識別準確率。
附圖說明
圖1是本發明實施例提供的語音識別方法的流程圖;
圖2是本發明實施例提供的語言模型的識別結果示意圖;
圖3是本發明實施例提供的電子設備的結構圖;
圖4是本發明另一實施例提供的電子設備的結構圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010127045.0/2.html,轉載請聲明來源鉆瓜專利網。





