[發(fā)明專利]語音識別方法、裝置、電子設備及存儲介質有效
| 申請?zhí)枺?/td> | 202110328573.7 | 申請日: | 2021-03-26 |
| 公開(公告)號: | CN113066480B | 公開(公告)日: | 2023-02-17 |
| 發(fā)明(設計)人: | 李俊博 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L15/183;G10L15/26 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 黃海英 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 識別 方法 裝置 電子設備 存儲 介質 | ||
1.一種語音識別方法,其特征在于,包括:
獲取待識別語音數據的聲學特征,并通過聲學模型將所述聲學特征處理為聲學表示,其中,所述聲學表示表征所述聲學特征屬于目標聲學符號序列的概率;
在由多個語言模型對應的子圖鏈接而成的搜索圖中,搜索得到所述聲學表示對應的多條解碼路徑,其中,所述多個語言模型以及鏈接關系由所述待識別語音數據所屬的業(yè)務場景確定,每個所述語言模型對應的子圖由聲學符號節(jié)點鏈接而成;
從所述多條解碼路徑中確定目標解碼路徑,獲取基于所述目標解碼路徑對所述聲學表示解碼得到的目標文本數據,并將所述目標文本數據確定為所述待識別語音數據的識別結果;
其中,在由多個語言模型對應的子圖鏈接而成的搜索圖中,搜索得到所述聲學表示對應的多條解碼路徑之前,所述方法還包括:
確定在所述業(yè)務場景下進行語音識別時,待使用的所述多個語言模型,以及所述多個語言模型的關聯關系,其中,所述關聯關系用于表征所述多個語言模型應用在語音識別過程中的前后關系或并列關系;
構建每個所述語言模型對應的子圖;
根據所述關聯關系確定所述多個語言模型對應的子圖之間的鏈接關系;
根據所述鏈接關系鏈接所述多個語言模型對應的子圖,得到所述搜索圖。
2.根據權利要求1所述的音識別方法,其特征在于,待使用的所述語言模型至少包括以下之一:
由所述業(yè)務場景的場景類型關聯的第一語料訓練得到第一語言模型;
由所述業(yè)務場景所屬的領域類型關聯的第二語料訓練得到的第二語言模型;
由所述業(yè)務場景下的話術語料訓練得到的第三語言模型;
由所述業(yè)務場景關聯的對象的個性化信息料訓練得到的第四語言模型;
基礎語言模型。
3.根據權利要求1所述的音識別方法,其特征在于,構建每個所述語言模型對應的子圖包括:
獲取所述語言模型的詞表;
根據所述聲學模型的發(fā)音詞典確定所述詞表中的每個詞對應的聲學符號,得到多個聲學符號;
建立所述多個聲學符號對應的聲學符號節(jié)點,以及由聲學符號序列構成的詞對應的詞節(jié)點,其中,相同的聲學符號對應同一個聲學符號節(jié)點;
根據所述多個聲學符號之間的跳轉關系鏈接多個所述聲學符號節(jié)點,并根據多個所述詞節(jié)點之間的跳轉關系鏈接多個所述詞節(jié)點,得到所述語言模型對應的子圖。
4.根據權利要求1所述的語音識別方法,其特征在于,根據所述鏈接關系鏈接所述多個語言模型對應的子圖,得到所述搜索圖包括:
構建所述搜索圖的起始節(jié)點;
根據所述業(yè)務場景下的語音識別路徑,構建所述識別路徑的至少一組首尾節(jié)點,其中,每組所述首尾節(jié)點包括句首節(jié)點和句尾節(jié)點;
建立所述起始節(jié)點與每個所述句首節(jié)點之間的鏈接,并根據所述多個語言模型對應的子圖之間的鏈接關系,將多個所述子圖鏈接在所述至少一組首尾節(jié)點之間,得到所述搜索圖,其中,每組所述首尾節(jié)點的所述句首節(jié)點和所述句尾節(jié)點之間至少鏈接有一個所述子圖。
5.根據權利要求4所述的語音識別方法,其特征在于,從所述多條解碼路徑中確定目標解碼路徑包括:
在每條所述解碼路徑中,分別計算所述句首節(jié)點和所述句首節(jié)點鏈接的子圖中之間的第一權重,計算相鄰兩個子圖之間的第二權重,計算所述句尾節(jié)點和所述句尾節(jié)點鏈接的子圖之間的第三權重,并基于所述聲學特征屬于所述目標聲學符號序列的概率、所述第一權重、所述第二權重以及所述第三權重確定所述解碼路徑的語音識別權重;
在所述多條解碼路徑中確定語音識別權重最高的解碼路徑,并將所述語音識別權重最高的解碼路徑確定為所述目標解碼路徑。
6.根據權利要求2所述的語音識別方法,其特征在于,所述多個語言模型中包括所述第四語言模型,在根據所述鏈接關系鏈接所述多個語言模型對應的子圖,得到所述搜索圖之后,所述方法還包括:
在所述業(yè)務場景關聯的對象發(fā)生變化的情況下,由變化后的對象的個性化信息料訓練語言模型,并根據訓練得到的語言模型更新所述第四語言模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110328573.7/1.html,轉載請聲明來源鉆瓜專利網。





