[發(fā)明專利]語音識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀介質(zhì)在審
| 申請?zhí)枺?/td> | 202011375211.5 | 申請日: | 2020-11-30 |
| 公開(公告)號(hào): | CN112530416A | 公開(公告)日: | 2021-03-19 |
| 發(fā)明(設(shè)計(jì))人: | 彭毅;蔡玉玉;范璐;全宗峰;吳俊儀;楊帆 | 申請(專利權(quán))人: | 北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司 |
| 主分類號(hào): | G10L15/183 | 分類號(hào): | G10L15/183;G10L15/26 |
| 代理公司: | 北京衛(wèi)智暢科專利代理事務(wù)所(普通合伙) 11557 | 代理人: | 陳佳 |
| 地址: | 101116 北京市北京經(jīng)濟(jì)技術(shù)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 識(shí)別 方法 裝置 設(shè)備 計(jì)算機(jī) 可讀 介質(zhì) | ||
本公開的實(shí)施例公開了語音識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì)。該方法的一個(gè)具體實(shí)施方式包括:基于用戶定制內(nèi)容生成定制語言模型;確定定制語言模型的第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī),其中,第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)的邊權(quán)重是根據(jù)用戶定制內(nèi)容的語言概率生成的;通過第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,對待處理語音進(jìn)行解碼,以生成待處理語音對應(yīng)的文本。該實(shí)施方式實(shí)現(xiàn)了提高語音識(shí)別的準(zhǔn)確率。
技術(shù)領(lǐng)域
本公開的實(shí)施例涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及語音識(shí)別方法、裝置、設(shè)備和計(jì)算機(jī)可讀介質(zhì)。
背景技術(shù)
隨著人工智能技術(shù)的高速發(fā)展,語音識(shí)別技術(shù)被廣泛應(yīng)用于會(huì)議內(nèi)容記錄、呼叫中心、人機(jī)交互等多個(gè)領(lǐng)域。與此同時(shí),用戶對于語音識(shí)別的需要也越來越多,不僅要求通用場景下的高識(shí)別率,還經(jīng)常會(huì)提出定制化需求,即在短時(shí)間內(nèi)提升某些定制內(nèi)容識(shí)別率。
為了滿足這種定制化需求,相關(guān)的語音識(shí)別技術(shù)主要有兩種解決辦法:第一,是將用戶定制內(nèi)容表示成文本,訓(xùn)練定制語言模型,然后和基礎(chǔ)語言模型插值,最終得到定制內(nèi)容概率增強(qiáng)的語言模型。然后,利用該增強(qiáng)的語言模型重新構(gòu)建解碼網(wǎng)絡(luò)進(jìn)行識(shí)別。第二,使用定制內(nèi)容生成一個(gè)新的與定制內(nèi)容相關(guān)的解碼網(wǎng)絡(luò)(簡稱定制網(wǎng)絡(luò))。當(dāng)語音輸入時(shí),在基礎(chǔ)解碼網(wǎng)絡(luò)和定制網(wǎng)絡(luò)上同時(shí)搜索,對基礎(chǔ)解碼網(wǎng)絡(luò)中的定制內(nèi)容重打分,增加其所在路徑的得分,進(jìn)而提高定制內(nèi)容的識(shí)別率。
這些語音識(shí)別技術(shù)主要存在以下技術(shù)問題:
第一,上述第一種解決辦法,生成插值語言模型后,需要將插值語言模型的WFST(Weighted Finite-State Transducer,加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī))和其它WFST進(jìn)行一系列復(fù)雜操作,重新生成最終的靜態(tài)解碼網(wǎng)絡(luò)。整個(gè)流程通常耗時(shí)長,迭代過程緩慢,很難滿足用戶緊急需求。
第二,上述第二種解決辦法,存在識(shí)別準(zhǔn)確率不高的問題。
發(fā)明內(nèi)容
本公開的內(nèi)容部分用于以簡要的形式介紹構(gòu)思,這些構(gòu)思將在后面的具體實(shí)施方式部分被詳細(xì)描述。本公開的內(nèi)容部分并不旨在標(biāo)識(shí)要求保護(hù)的技術(shù)方案的關(guān)鍵特征或必要特征,也不旨在用于限制所要求的保護(hù)的技術(shù)方案的范圍。本公開的一些實(shí)施例提出了語音識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀介質(zhì),來解決以上背景技術(shù)部分提到的技術(shù)問題。
第一方面,本公開的一些實(shí)施例提供了一種語音識(shí)別方法,該方法包括:基于用戶定制內(nèi)容生成定制語言模型;確定定制語言模型的第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī),其中,第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)的邊權(quán)重是根據(jù)用戶定制內(nèi)容的語言概率生成的;通過第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,對待處理語音進(jìn)行解碼,以生成待處理語音對應(yīng)的文本。
第二方面,本公開的一些實(shí)施例提供了一種語音識(shí)別裝置,裝置包括:生成單元,被配置成基于用戶定制內(nèi)容生成定制語言模型;確定單元,被配置成確定定制語言模型的第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī),其中,第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)的邊權(quán)重是根據(jù)用戶定制內(nèi)容的語言概率生成的;解碼單元,被配置成通過第一加權(quán)有限狀態(tài)轉(zhuǎn)換機(jī)和基礎(chǔ)解碼網(wǎng)路聯(lián)合搜索,對待處理語音進(jìn)行解碼,以生成待處理語音對應(yīng)的文本。
第三方面,本公開的一些實(shí)施例提供了一種電子設(shè)備,包括:一個(gè)或多個(gè)處理器;存儲(chǔ)裝置,其上存儲(chǔ)有一個(gè)或多個(gè)程序,當(dāng)一個(gè)或多個(gè)程序被一個(gè)或多個(gè)處理器執(zhí)行,使得一個(gè)或多個(gè)處理器實(shí)現(xiàn)如第一方面中任一實(shí)現(xiàn)方式描述的方法。
第四方面,本公開的一些實(shí)施例提供了一種計(jì)算機(jī)可讀介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其中,程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如第一方面中任一實(shí)現(xiàn)方式描述的方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司,未經(jīng)北京沃東天駿信息技術(shù)有限公司;北京京東世紀(jì)貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011375211.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測試終端的測試方法
- 一種服裝用人體測量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





