[發(fā)明專利]語音識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202011375211.5 | 申請(qǐng)日: | 2020-11-30 |
| 公開(公告)號(hào): | CN112530416A | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 彭毅;蔡玉玉;范璐;全宗峰;吳俊儀;楊帆 | 申請(qǐng)(專利權(quán))人: | 北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號(hào): | G10L15/183 | 分類號(hào): | G10L15/183;G10L15/26 |
| 代理公司: | 北京衛(wèi)智暢科專利代理事務(wù)所(普通合伙) 11557 | 代理人: | 陳佳 |
| 地址: | 101116 北京市北京經(jīng)濟(jì)技術(shù)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識(shí)別 方法 裝置 設(shè)備 計(jì)算機(jī) 可讀 介質(zhì) | ||
1.一種語音識(shí)別方法,包括:
基于用戶定制內(nèi)容生成定制語言模型;
確定所述定制語言模型的第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī),其中,所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)的邊權(quán)重是根據(jù)所述用戶定制內(nèi)容的語言概率生成的;
通過所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,對(duì)待處理語音進(jìn)行解碼,以生成所述待處理語音對(duì)應(yīng)的文本。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述基于用戶定制內(nèi)容生成定制語言模型,包括:
利用所述用戶定制內(nèi)容,訓(xùn)練初始語言模型,得到訓(xùn)練語言模型;
將所述訓(xùn)練語言模型和基礎(chǔ)語言模型進(jìn)行插值,得到所述定制語言模型。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述確定所述定制語言模型的第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī),包括:
對(duì)所述用戶定制內(nèi)容中的每個(gè)語句執(zhí)行以下處理步驟:
對(duì)所述語句進(jìn)行分詞,得到所述語句對(duì)應(yīng)的詞序列;
確定所述詞序列在所述定制語言模型和所述基礎(chǔ)語言模型上的語言概率的差值;基于所述差值和所述詞序列中詞的個(gè)數(shù),確定所述詞序列中每個(gè)詞對(duì)應(yīng)的權(quán)重;基于所述詞序列和所述每個(gè)詞對(duì)應(yīng)的權(quán)重,生成所述語句對(duì)應(yīng)的鏈?zhǔn)郊訖?quán)有限狀態(tài)轉(zhuǎn)換機(jī);
將所述用戶定制內(nèi)容中的各個(gè)語句對(duì)應(yīng)的鏈?zhǔn)郊訖?quán)有限狀態(tài)轉(zhuǎn)換機(jī)進(jìn)行組合,得到所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)。
4.根據(jù)權(quán)利要求3所述的方法,其中,所述鏈?zhǔn)郊訖?quán)有限狀態(tài)轉(zhuǎn)換機(jī)中只將開頭狀態(tài)和結(jié)尾狀態(tài)設(shè)置為終止?fàn)顟B(tài);以及
所述通過所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,對(duì)待處理語音進(jìn)行解碼,以生成所述待處理語音對(duì)應(yīng)的文本,包括:
通過令牌傳遞算法對(duì)所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,以對(duì)所述待處理語音進(jìn)行解碼,以及生成所述待處理語音對(duì)應(yīng)的文本。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述通過令牌傳遞算法對(duì)所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,包括:
初始化令牌,所述令牌中包括狀態(tài)對(duì),所述狀態(tài)對(duì)中包括所述基礎(chǔ)解碼網(wǎng)路的第一狀態(tài)和所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)的第二狀態(tài),所述第一狀態(tài)的初始狀態(tài)為所述基礎(chǔ)解碼網(wǎng)路的初始狀態(tài),所述第二狀態(tài)的初始狀態(tài)為所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)的初始狀態(tài);
獲取所述待處理語音中的目標(biāo)語音幀的語音特征,執(zhí)行以下狀態(tài)轉(zhuǎn)移步驟:
所述第一狀態(tài)沿出邊轉(zhuǎn)移到下一狀態(tài),輸出所述第一狀態(tài)出邊的輸出符號(hào);
確定所述輸出符號(hào)與所述第二狀態(tài)的出邊的輸入符號(hào)是否相同;
響應(yīng)于確定所述輸出符號(hào)與所述第二狀態(tài)的出邊的輸入符號(hào)不相同,確定所述第二狀態(tài)是否為初始狀態(tài)或終止?fàn)顟B(tài);
響應(yīng)于確定所述第二狀態(tài)不是初始狀態(tài)或終止?fàn)顟B(tài),丟棄所述令牌。
6.根據(jù)權(quán)利要求5所述的方法,其中,所述通過令牌傳遞算法對(duì)所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,包括:
響應(yīng)于確定所述輸出符號(hào)與所述第二狀態(tài)的出邊的輸入符號(hào)相同,構(gòu)建新令牌,所述新令牌的狀態(tài)對(duì)包括所述下一狀態(tài)和所述第二狀態(tài)沿出邊轉(zhuǎn)移的目的狀態(tài),輸出所述第二狀態(tài)出邊的輸出符號(hào);
確定所述第二狀態(tài)是否為初始狀態(tài);
響應(yīng)于確定所述第二狀態(tài)是初始狀態(tài),再次構(gòu)建新令牌,再次構(gòu)建的新令牌的狀態(tài)對(duì)包括所述下一狀態(tài)和所述第二狀態(tài),以及將所述第一狀態(tài)出邊的開銷確定為合并開銷;
根據(jù)所述合并開銷更新令牌中的總開銷。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述通過令牌傳遞算法對(duì)所述第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,包括:
響應(yīng)于確定所述目標(biāo)語音幀是所述待處理語音中最后一幀,從各個(gè)令牌里確定兩個(gè)狀態(tài)均為終止?fàn)顟B(tài)的令牌作為目標(biāo)令牌;
將開銷最小的目標(biāo)令牌對(duì)應(yīng)的路徑確定為解碼路徑。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011375211.5/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





