[發(fā)明專利]一種目標語言模型確定方法及裝置在審
| 申請?zhí)枺?/td> | 202310582619.7 | 申請日: | 2023-05-23 |
| 公開(公告)號: | CN116597827A | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設(shè)計)人: | 魏子軒;徐媛媛;周劍;楚建霞 | 申請(專利權(quán))人: | 蘇州科帕特信息科技有限公司 |
| 主分類號: | G10L15/187 | 分類號: | G10L15/187;G10L15/00;G10L15/02;G10L15/06;G10L15/07;G10L15/26;G06F16/683;G06F16/35 |
| 代理公司: | 北京卓勝佰達知識產(chǎn)權(quán)代理有限公司 16026 | 代理人: | 張串串 |
| 地址: | 215500 江蘇省蘇州*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 目標 語言 模型 確定 方法 裝置 | ||
本發(fā)明提供一種目標語言模型確定方法及裝置,涉及語音識別技術(shù)領(lǐng)域。該目標語言模型確定裝置,包括中央處理器、語音獲取模塊、訓(xùn)練模塊和數(shù)據(jù)庫,中央處理器后端固定連接有轉(zhuǎn)換模塊,轉(zhuǎn)換模塊后端固定連接有提取模塊,提取模塊后端固定連接有確定模塊,語音獲取模塊后端固定連接有語言識別模塊和音色識別模塊,語言識別模塊和音色識別模塊與中央處理器相連,提取模塊與數(shù)據(jù)庫固定連接,數(shù)據(jù)庫與訓(xùn)練模塊相連。本發(fā)明將單個用戶的信息和音色儲存在獨立的子數(shù)據(jù)庫內(nèi)部,能快速且精準的對用戶發(fā)出的語音進行識別確定。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,具體為一種目標語言模型確定方法及裝置。
背景技術(shù)
隨著語音識別技術(shù)的發(fā)展,語音識別技術(shù)開始廣泛應(yīng)用于車載場景中。當前業(yè)界使用頻率最高的語音識別技術(shù)方案基于聲學(xué)模型和語言模型融合的體系進行構(gòu)建,語言模型(LanguageMode?l)簡單來說就是一串詞序列的概率分布。具體來說,語言模型的作用是為一個長度為m的文本確定一個概率分布P,表示這段文本存在的可能性。
在面對不同的使用者時,每個人的音色和發(fā)聲不同,存在發(fā)聲不清的現(xiàn)象,因此在同樣的發(fā)音時,語音識別系統(tǒng)通常會識別多個不同的版本,且識別效率慢,同時外界有聲音時,也會將此聲音錄入,降低識別的精準性和效率。因此,本領(lǐng)域技術(shù)人員提供了一種目標語言模型確定方法及裝置,以解決上述背景技術(shù)中提出的問題。
發(fā)明內(nèi)容
(一)解決的技術(shù)問題
針對現(xiàn)有技術(shù)的不足,本發(fā)明提供了一種目標語言模型確定方法及裝置,本發(fā)明將單個用戶的信息和音色儲存在獨立的子數(shù)據(jù)庫內(nèi)部,能快速且精準的對用戶發(fā)出的語音進行識別確定。
(二)技術(shù)方案
為實現(xiàn)以上目的,本發(fā)明通過以下技術(shù)方案予以實現(xiàn):一種目標語言模型確定方法及裝置,包括中央處理器、語音獲取模塊、訓(xùn)練模塊和數(shù)據(jù)庫,中央處理器后端固定連接有轉(zhuǎn)換模塊,轉(zhuǎn)換模塊后端固定連接有提取模塊,提取模塊后端固定連接有確定模塊,語音獲取模塊后端固定連接有語言識別模塊和音色識別模塊,語言識別模塊和音色識別模塊與中央處理器相連,提取模塊與數(shù)據(jù)庫固定連接,數(shù)據(jù)庫與訓(xùn)練模塊相連。
優(yōu)選的,語音獲取模塊用于將用戶發(fā)出的語音進行獲取提取,語言識別模塊對用戶發(fā)出的語音種類進行識別,音色識別模塊用于對用戶發(fā)出的語音音色進行識別。
優(yōu)選的,訓(xùn)練模塊包括訓(xùn)練文件、音色提取和生成模塊,訓(xùn)練文件為單個用戶信息,如通訊錄名稱信息與其它信息,音色提取模塊用于對單個用戶的聲音音色進行提取,生成模塊用于將同一用戶提取的信息和音色生成一個語言模型。
優(yōu)選的,數(shù)據(jù)庫包括至少兩個子數(shù)據(jù)庫,用于儲存不同用戶生成的語言模型,如同一個用戶信息、音色生成的模型儲存在單獨的子數(shù)據(jù)庫內(nèi)部,另一個用戶的語言模型儲存在另一個獨立的子數(shù)據(jù)庫內(nèi)部。
優(yōu)選的,轉(zhuǎn)換模塊用于將用戶發(fā)出的除中文外的語種進行翻譯轉(zhuǎn)換,并將其轉(zhuǎn)換為文本信息,提取模塊用于將數(shù)據(jù)庫中的子數(shù)據(jù)庫數(shù)據(jù)進行提取并比對。
優(yōu)選的,確定模塊最終確定出用于發(fā)出的語音信息。
一種目標語言模型確定方法,包括以下步驟:
S1.用戶發(fā)出語音請求
用戶通過發(fā)出語音喚醒語音識別系統(tǒng);
S2.語言、音色識別
通過語言識別模塊對用戶發(fā)出的語言種類進行識別,通過音色識別模塊對用戶發(fā)出的音色進行識別;
S3.語言轉(zhuǎn)換
將識別的語言種類轉(zhuǎn)換為文本信息,并將其進行分類;
S4.數(shù)據(jù)提取
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州科帕特信息科技有限公司,未經(jīng)蘇州科帕特信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310582619.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





