[發明專利]語音識別方法、裝置、設備及存儲介質在審
| 申請號: | 202110310488.8 | 申請日: | 2021-03-23 |
| 公開(公告)號: | CN112927695A | 公開(公告)日: | 2021-06-08 |
| 發明(設計)人: | 李潔瓊;邵鵬;應臻奕;李國慶 | 申請(專利權)人: | 上海仙塔智能科技有限公司;上海仙豆智能機器人有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/26;G10L15/06 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 余菲 |
| 地址: | 200050 上海市長寧區長*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 設備 存儲 介質 | ||
本申請提供一種語音識別方法、裝置、設備及存儲介質,其中,語音識別方法包括:獲取輸入語音;基于聲學模型和第一語言模型對所述輸入語音進行解碼,得到所述輸入語音的第一識別文本;對所述輸入語音的第一識別文本進行話術分類,以標記出所述輸入語音的第一識別文本的類別標簽;根據所述第一識別文本的類別標簽選擇第二語言模型,所述第二語言模型根據所述第一識別文本的類別標簽對應的訓練樣本得到;根據所述語言模型對所述輸入語音重新對所述輸入語音進行解碼,以得到所述輸入語音的第二識別文本。本申請能夠在提供重點領域的語音識別精確度的同時,不降低非重點語音的識別精度,且本申請具有易于更新的優點。
技術領域
本申請涉及語音識別領域,具體而言,涉及一種語音識別方法、裝置、設備及存儲介質。
背景技術
車載語音助手發展在近幾年越來越受到大眾的關注。場景為用戶在開車途中,能借助一個車內助手方便的完成駕駛員一些指令,又能免于駕駛員觸摸屏幕做點擊動作,如此安全又方便的方式,為駕車人帶來愉悅舒適的體驗。車內語音助手與用戶交互的方式,首先是接受用戶發出的語音,將其經過語音識別系統識別為文字后,再對文本做自然語言處理,給出車機反饋。目前,車機助手通常包含的功能有:車控部分,例如打開車窗、調節空調溫度等;媒體部分,例如播放某歌曲,播放某廣播電臺;導航部分,例如導航去某地,導航走躲避擁堵路線等;通話部分,例如給某人打電話,接聽某人的電話等。如上應用是駕車人在開車場景中常常出現的幾種需求,借助車內語音助手,可以在駕駛員免于低頭查找及點擊屏幕的情況下,僅靠語音發出指令,由車機助手完成指令動作,這對于駕車人的駕車安全性,駕車愉悅度方面都是質的提升。
在如上四種應用場景中,尤為后三種場景接受到的語音指令比較復雜。媒體播放領域,包含的歌名,歌手名名目繁多,且更新較快;導航領域,包含的店鋪名,道路名也極其繁多。通話領域,包含的人名也會名目繁多又有變化。
常規的語音識別系統,包含一個聲學模型和一個語言模型。其中語言模型由大量文本訓練生成。在語音識別過程中,此處稱之為解碼過程中,對輸入的語音,先經過聲學模型和三階的語言模型,給出解碼的識別文本結果,此處得到多個備選項,稱為NBEST,再對這些得到的識別結果,再次經過更高階的語言模型做重新解碼,最終將重新解碼后語言模型得分最高的結果作為識別結果輸出。由此可見,語音識別系統中,語言模型占據很重要的位置。
常規方法是語言模型使用各種領域的大量文本訓練生成,包括媒體領域,導航領域,通話領域,如此必然會加入大量該三塊領域的文本,導致語言模型大小變得龐大且不易更新,同時大量的此三類領域的文本加入,會降低其他領域在語言模型中的概率,比如閑聊領域,天氣查詢領域,車控領域等,從而降低其他領域輸入句子的識別準確率。
發明內容
本申請實施例的目的在于提供一種語音識別方法、裝置、設備及存儲介質,用以結合自然語言處理的話術分類模型以及分領域的語言模型進行語音識別,從而提升語音識別效果,尤其是能夠在車機助手使用場景中,提高重點領域的語音識別精確度,而不降低非重點領域的語音識別效果。
為此,本申請第一方面公開一種語音識別方法,所述方法包括:
獲取輸入語音;
基于聲學模型和第一語言模型對所述輸入語音進行解碼,得到所述輸入語音的第一識別文本;
對所述輸入語音的第一識別文本進行話術分類,以標記出所述輸入語音的第一識別文本的類別標簽;
根據所述第一識別文本的類別標簽選擇第二語言模型,所述第二語言模型根據所述第一識別文本的類別標簽對應的訓練樣本得到;
根據所述第二語言模型對所述輸入語音進行解碼,以得到所述輸入語音的第二識別文本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海仙塔智能科技有限公司;上海仙豆智能機器人有限公司,未經上海仙塔智能科技有限公司;上海仙豆智能機器人有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110310488.8/2.html,轉載請聲明來源鉆瓜專利網。





