[發(fā)明專利]語音識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)有效
| 申請(qǐng)?zhí)枺?/td> | 202110328573.7 | 申請(qǐng)日: | 2021-03-26 |
| 公開(公告)號(hào): | CN113066480B | 公開(公告)日: | 2023-02-17 |
| 發(fā)明(設(shè)計(jì))人: | 李俊博 | 申請(qǐng)(專利權(quán))人: | 北京達(dá)佳互聯(lián)信息技術(shù)有限公司 |
| 主分類號(hào): | G10L15/02 | 分類號(hào): | G10L15/02;G10L15/06;G10L15/183;G10L15/26 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 黃海英 |
| 地址: | 100089 北京市海淀*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識(shí)別 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本公開關(guān)于一種語音識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),該方法包括:獲取待識(shí)別語音數(shù)據(jù)的聲學(xué)特征,并通過聲學(xué)模型將聲學(xué)特征處理為聲學(xué)表示;在由多個(gè)語言模型對(duì)應(yīng)的子圖鏈接而成的搜索圖中,搜索得到聲學(xué)表示對(duì)應(yīng)的多條解碼路徑;從多條解碼路徑中確定目標(biāo)解碼路徑,獲取基于目標(biāo)解碼路徑對(duì)聲學(xué)表示解碼得到的目標(biāo)文本數(shù)據(jù),并將目標(biāo)文本數(shù)據(jù)確定為待識(shí)別語音數(shù)據(jù)的識(shí)別結(jié)果,本公開至少解決相關(guān)技術(shù)中單一語言模型難以支持復(fù)雜應(yīng)用場(chǎng)景下的語音識(shí)別需求的問題。
技術(shù)領(lǐng)域
本公開涉及語音識(shí)別技術(shù)領(lǐng)域,尤其涉及一種語音識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
隨著語音識(shí)別技術(shù)的發(fā)展,語音識(shí)別內(nèi)容越來越豐富,語音識(shí)別所屬的業(yè)務(wù)場(chǎng)景也越來越復(fù)雜,單一語言模型難以支持復(fù)雜應(yīng)用場(chǎng)景下的語音識(shí)別。
為了復(fù)雜應(yīng)用場(chǎng)景下的語音識(shí)別效果,相關(guān)技術(shù)中出現(xiàn)了以下方案:將應(yīng)用場(chǎng)景的相關(guān)領(lǐng)域的語料均加入基礎(chǔ)語言模型的訓(xùn)練中,訓(xùn)練得到統(tǒng)一的語言模型;或是在同一個(gè)語言模型上,根據(jù)具體的應(yīng)用場(chǎng)景,將相關(guān)領(lǐng)域的語料進(jìn)行插值,得到一個(gè)新的語言模型;然后再基于得到的語言模型進(jìn)行HCLG構(gòu)圖,并解碼得到語音識(shí)別結(jié)果。
但是,相關(guān)技術(shù)中的語音識(shí)別方法,根據(jù)各個(gè)領(lǐng)域的語料訓(xùn)練得到的語言模型,會(huì)弱化每個(gè)領(lǐng)域的識(shí)別效果,使得語音識(shí)別的結(jié)果不夠準(zhǔn)確。
針對(duì)相關(guān)技術(shù)中單一語言模型難以支持復(fù)雜應(yīng)用場(chǎng)景下的語音識(shí)別需求的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本公開提供一種語音識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以至少解決相關(guān)技術(shù)中單一語言模型難以支持復(fù)雜應(yīng)用場(chǎng)景下的語音識(shí)別需求的問題。本公開的技術(shù)方案如下:
根據(jù)本公開實(shí)施例的第一方面,提供一種語音識(shí)別方法,包括:獲取待識(shí)別語音數(shù)據(jù)的聲學(xué)特征,并通過聲學(xué)模型將聲學(xué)特征處理為聲學(xué)表示,其中,聲學(xué)表示表征聲學(xué)特征屬于目標(biāo)聲學(xué)符號(hào)序列的概率;在由多個(gè)語言模型對(duì)應(yīng)的子圖鏈接而成的搜索圖中,搜索得到聲學(xué)表示對(duì)應(yīng)的多條解碼路徑,其中,多個(gè)語言模型以及鏈接關(guān)系由待識(shí)別語音數(shù)據(jù)所屬的業(yè)務(wù)場(chǎng)景確定,每個(gè)語言模型對(duì)應(yīng)的子圖由聲學(xué)符號(hào)節(jié)點(diǎn)鏈接而成;從多條解碼路徑中確定目標(biāo)解碼路徑,獲取基于目標(biāo)解碼路徑對(duì)聲學(xué)表示解碼得到的目標(biāo)文本數(shù)據(jù),并將目標(biāo)文本數(shù)據(jù)確定為待識(shí)別語音數(shù)據(jù)的識(shí)別結(jié)果。
可選地,在由多個(gè)語言模型對(duì)應(yīng)的子圖鏈接而成的搜索圖中,搜索得到聲學(xué)表示對(duì)應(yīng)的多條解碼路徑之前,該方法還包括:確定在業(yè)務(wù)場(chǎng)景下進(jìn)行語音識(shí)別時(shí),待使用的多個(gè)語言模型,以及多個(gè)語言模型的關(guān)聯(lián)關(guān)系,其中,關(guān)聯(lián)關(guān)系用于表征多個(gè)語言模型應(yīng)用在語音識(shí)別過程中的前后關(guān)系或并列關(guān)系;構(gòu)建每個(gè)語言模型對(duì)應(yīng)的子圖;根據(jù)關(guān)聯(lián)關(guān)系確定多個(gè)語言模型對(duì)應(yīng)的子圖之間的鏈接關(guān)系;根據(jù)鏈接關(guān)系鏈接多個(gè)語言模型對(duì)應(yīng)的子圖,得到搜索圖。
可選地,待使用的語言模型至少包括以下之一:由業(yè)務(wù)場(chǎng)景的場(chǎng)景類型關(guān)聯(lián)的第一語料訓(xùn)練得到第一語言模型;由業(yè)務(wù)場(chǎng)景所屬的領(lǐng)域類型關(guān)聯(lián)的第二語料訓(xùn)練得到的第二語言模型;由業(yè)務(wù)場(chǎng)景下的話術(shù)語料訓(xùn)練得到的第三語言模型;由業(yè)務(wù)場(chǎng)景關(guān)聯(lián)的對(duì)象的個(gè)性化信息料訓(xùn)練得到的第四語言模型;基礎(chǔ)語言模型。
可選地,構(gòu)建每個(gè)語言模型對(duì)應(yīng)的子圖包括:獲取語言模型的詞表;根據(jù)聲學(xué)模型的發(fā)音詞典確定詞表中的每個(gè)詞對(duì)應(yīng)的聲學(xué)符號(hào),得到多個(gè)聲學(xué)符號(hào);建立多個(gè)聲學(xué)符號(hào)對(duì)應(yīng)的聲學(xué)符號(hào)節(jié)點(diǎn),以及由聲學(xué)符號(hào)序列構(gòu)成的詞對(duì)應(yīng)的詞節(jié)點(diǎn),其中,相同的聲學(xué)符號(hào)對(duì)應(yīng)同一個(gè)聲學(xué)符號(hào)節(jié)點(diǎn);根據(jù)多個(gè)聲學(xué)符號(hào)之間的跳轉(zhuǎn)關(guān)系鏈接多個(gè)聲學(xué)符號(hào)節(jié)點(diǎn),并根據(jù)多個(gè)詞節(jié)點(diǎn)之間的跳轉(zhuǎn)關(guān)系鏈接多個(gè)詞節(jié)點(diǎn),得到語言模型對(duì)應(yīng)的子圖。
可選地,根據(jù)鏈接關(guān)系鏈接多個(gè)語言模型對(duì)應(yīng)的子圖,得到搜索圖包括:構(gòu)建搜索圖的起始節(jié)點(diǎn);根據(jù)業(yè)務(wù)場(chǎng)景下的語音識(shí)別路徑,構(gòu)建識(shí)別路徑的至少一組首尾節(jié)點(diǎn),其中,每組首尾節(jié)點(diǎn)包括句首節(jié)點(diǎn)和句尾節(jié)點(diǎn);建立起始節(jié)點(diǎn)與每個(gè)句首節(jié)點(diǎn)之間的鏈接,并根據(jù)多個(gè)語言模型對(duì)應(yīng)的子圖之間的鏈接關(guān)系,將多個(gè)子圖鏈接在至少一組首尾節(jié)點(diǎn)之間,得到搜索圖,其中,每組首尾節(jié)點(diǎn)的句首節(jié)點(diǎn)和句尾節(jié)點(diǎn)之間至少鏈接有一個(gè)子圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京達(dá)佳互聯(lián)信息技術(shù)有限公司,未經(jīng)北京達(dá)佳互聯(lián)信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110328573.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





