[發(fā)明專利]一種目標語言模型確定方法及裝置在審

申請?zhí)枺?/td>	202310582619.7	申請日：	2023-05-23
公開（公告）號：	CN116597827A	公開（公告）日：	2023-08-15
發(fā)明（設(shè)計）人：	魏子軒;徐媛媛;周劍;楚建霞	申請（專利權(quán)）人：	蘇州科帕特信息科技有限公司
主分類號：	G10L15/187	分類號：	G10L15/187;G10L15/00;G10L15/02;G10L15/06;G10L15/07;G10L15/26;G06F16/683;G06F16/35
代理公司：	北京卓勝佰達知識產(chǎn)權(quán)代理有限公司 16026	代理人：	張串串
地址：	215500 江蘇省蘇州***	國省代碼：	江蘇;32
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種目標語言模型確定方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明提供一種目標語言模型確定方法及裝置，涉及語音識別技術(shù)領(lǐng)域。該目標語言模型確定裝置，包括中央處理器、語音獲取模塊、訓(xùn)練模塊和數(shù)據(jù)庫，中央處理器后端固定連接有轉(zhuǎn)換模塊，轉(zhuǎn)換模塊后端固定連接有提取模塊，提取模塊后端固定連接有確定模塊，語音獲取模塊后端固定連接有語言識別模塊和音色識別模塊，語言識別模塊和音色識別模塊與中央處理器相連，提取模塊與數(shù)據(jù)庫固定連接，數(shù)據(jù)庫與訓(xùn)練模塊相連。本發(fā)明將單個用戶的信息和音色儲存在獨立的子數(shù)據(jù)庫內(nèi)部，能快速且精準的對用戶發(fā)出的語音進行識別確定。

技術(shù)領(lǐng)域

本發(fā)明涉及語音識別技術(shù)領(lǐng)域，具體為一種目標語言模型確定方法及裝置。

背景技術(shù)

隨著語音識別技術(shù)的發(fā)展，語音識別技術(shù)開始廣泛應(yīng)用于車載場景中。當前業(yè)界使用頻率最高的語音識別技術(shù)方案基于聲學(xué)模型和語言模型融合的體系進行構(gòu)建，語言模型(LanguageMode?l)簡單來說就是一串詞序列的概率分布。具體來說，語言模型的作用是為一個長度為m的文本確定一個概率分布P，表示這段文本存在的可能性。

在面對不同的使用者時，每個人的音色和發(fā)聲不同，存在發(fā)聲不清的現(xiàn)象，因此在同樣的發(fā)音時，語音識別系統(tǒng)通常會識別多個不同的版本，且識別效率慢，同時外界有聲音時，也會將此聲音錄入，降低識別的精準性和效率。因此，本領(lǐng)域技術(shù)人員提供了一種目標語言模型確定方法及裝置，以解決上述背景技術(shù)中提出的問題。

發(fā)明內(nèi)容

(一)解決的技術(shù)問題

針對現(xiàn)有技術(shù)的不足，本發(fā)明提供了一種目標語言模型確定方法及裝置，本發(fā)明將單個用戶的信息和音色儲存在獨立的子數(shù)據(jù)庫內(nèi)部，能快速且精準的對用戶發(fā)出的語音進行識別確定。

(二)技術(shù)方案

為實現(xiàn)以上目的，本發(fā)明通過以下技術(shù)方案予以實現(xiàn)：一種目標語言模型確定方法及裝置，包括中央處理器、語音獲取模塊、訓(xùn)練模塊和數(shù)據(jù)庫，中央處理器后端固定連接有轉(zhuǎn)換模塊，轉(zhuǎn)換模塊后端固定連接有提取模塊，提取模塊后端固定連接有確定模塊，語音獲取模塊后端固定連接有語言識別模塊和音色識別模塊，語言識別模塊和音色識別模塊與中央處理器相連，提取模塊與數(shù)據(jù)庫固定連接，數(shù)據(jù)庫與訓(xùn)練模塊相連。

優(yōu)選的，語音獲取模塊用于將用戶發(fā)出的語音進行獲取提取，語言識別模塊對用戶發(fā)出的語音種類進行識別，音色識別模塊用于對用戶發(fā)出的語音音色進行識別。

優(yōu)選的，訓(xùn)練模塊包括訓(xùn)練文件、音色提取和生成模塊，訓(xùn)練文件為單個用戶信息，如通訊錄名稱信息與其它信息，音色提取模塊用于對單個用戶的聲音音色進行提取，生成模塊用于將同一用戶提取的信息和音色生成一個語言模型。

優(yōu)選的，數(shù)據(jù)庫包括至少兩個子數(shù)據(jù)庫，用于儲存不同用戶生成的語言模型，如同一個用戶信息、音色生成的模型儲存在單獨的子數(shù)據(jù)庫內(nèi)部，另一個用戶的語言模型儲存在另一個獨立的子數(shù)據(jù)庫內(nèi)部。

優(yōu)選的，轉(zhuǎn)換模塊用于將用戶發(fā)出的除中文外的語種進行翻譯轉(zhuǎn)換，并將其轉(zhuǎn)換為文本信息，提取模塊用于將數(shù)據(jù)庫中的子數(shù)據(jù)庫數(shù)據(jù)進行提取并比對。

優(yōu)選的，確定模塊最終確定出用于發(fā)出的語音信息。

一種目標語言模型確定方法，包括以下步驟：

S1.用戶發(fā)出語音請求

用戶通過發(fā)出語音喚醒語音識別系統(tǒng)；

S2.語言、音色識別

通過語言識別模塊對用戶發(fā)出的語言種類進行識別，通過音色識別模塊對用戶發(fā)出的音色進行識別；

S3.語言轉(zhuǎn)換

將識別的語言種類轉(zhuǎn)換為文本信息，并將其進行分類；

S4.數(shù)據(jù)提取

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州科帕特信息科技有限公司，未經(jīng)蘇州科帕特信息科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202310582619.7/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：設(shè)置設(shè)備地址的方法及芯片
下一篇：一種基于嵌入式控制的病理切片掃描儀

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費下載

滑坡模型實驗?zāi)Ｐ图?/a>

專利文獻下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】