[發(fā)明專利]基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法及其系統(tǒng)在審

申請(qǐng)?zhí)枺?/td>	202111448714.5	申請(qǐng)日：	2021-12-01
公開(kāi)（公告）號(hào)：	CN114333788A	公開(kāi)（公告）日：	2022-04-12
發(fā)明（設(shè)計(jì)）人：	游海濤;吳昊	申請(qǐng)（專利權(quán)）人：	廈門萬(wàn)勢(shì)順易科技有限公司
主分類號(hào)：	G10L15/06	分類號(hào)：	G10L15/06;G10L15/22;G10L15/26;G06F16/35;G06F40/242;G06F40/295
代理公司：	北京權(quán)智天下知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11638	代理人：	余喜娣
地址：	361000 福建省廈門市思***	國(guó)省代碼：	福建;35
權(quán)利要求書：	查看更多	說(shuō)明書：	查看更多
摘要：
搜索關(guān)鍵詞：	基于用戶意圖分析語(yǔ)音識(shí)別矯正方法及其系統(tǒng)
鉆瓜網(wǎng) 技術(shù)展會(huì) 專利詞庫(kù) 專利權(quán)人專利榜在售專利公布日期熱門專利

【權(quán)利要求書】：

1.基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于，包括以下方法：

S1、建立客制化字典數(shù)據(jù)庫(kù)；

S2、獲取用戶輸入的語(yǔ)音信息，并根據(jù)客制化字典數(shù)據(jù)庫(kù)轉(zhuǎn)化為文本信息；

S3、根據(jù)所述文本信息進(jìn)行意圖分析；

S4、根據(jù)意圖分析結(jié)果使用基于神經(jīng)網(wǎng)絡(luò)的BERT+BILSTM+CRF模型進(jìn)行命名實(shí)體識(shí)別，并提取實(shí)體；

S5、基于拼音及數(shù)據(jù)庫(kù)根據(jù)提取實(shí)體進(jìn)行錯(cuò)字替換，并輸出正確文本信息。

2.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：所述意圖分析包括純語(yǔ)音信息識(shí)別、刪除語(yǔ)音信息、編輯語(yǔ)音信息中的一種或多種，其中所述刪除語(yǔ)音信息包括：根據(jù)不同情景，進(jìn)行實(shí)體提取，指定語(yǔ)句刪除。

3.根據(jù)權(quán)利要求2所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：當(dāng)意圖分析為編輯語(yǔ)音信息或刪除語(yǔ)音信息，則進(jìn)入命名實(shí)體識(shí)別和提取；反之，則進(jìn)行純語(yǔ)音信息識(shí)別。

4.根據(jù)權(quán)利要求3所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：所述意圖分析采用bert文本分類模型，將句子中的單字word embedding輸入bert文本分類模型預(yù)測(cè)句子的類別，且當(dāng)softmax層后的三個(gè)意圖的預(yù)測(cè)概率中最大值不到88％時(shí)，則本句的意圖為純語(yǔ)音信息識(shí)別；若在此情況下確實(shí)想表達(dá)的是編輯語(yǔ)音信息或刪除語(yǔ)音信息，則說(shuō)明文本意圖不夠明顯，需換一種邏輯重新說(shuō)明。

5.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：所述命名實(shí)體包括必填詞槽、非必填詞槽，所述必填詞槽包括被修正字、線索詞組、組成成分中的一種或多種；所述非必填詞槽包括組成成分詞組、被修正字詞組、指定序數(shù)詞中的一種或多種。

6.根據(jù)權(quán)利要求5所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：所述步驟S5中基于拼音及數(shù)據(jù)庫(kù)根據(jù)提取實(shí)體進(jìn)行錯(cuò)字替換包括：

將提取實(shí)體和待處理文本信息轉(zhuǎn)化為拼音，并進(jìn)行匹配；

根據(jù)匹配結(jié)果確認(rèn)正確字索引位置；

索引字正規(guī)化，并將文本信息中的索引字替換為正確字。

7.根據(jù)權(quán)利要求6所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：在進(jìn)行匹配前，當(dāng)不存在修正字詞組時(shí)，直接匹配得到正確字索引；當(dāng)存在修正字詞組時(shí)，先使用修正字詞組匹配待選位置索引，再使用被修正字拼音在待索引里匹配位置索引。

8.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：所述步驟S5中數(shù)據(jù)庫(kù)包括新華字典數(shù)據(jù)庫(kù)，所述新華字典數(shù)據(jù)庫(kù)為復(fù)合多元庫(kù)，包括按中國(guó)拼音常用分析結(jié)果的詞頻順序排列、以及每個(gè)字包含其拼音和組成成分，而所述組成成分包含其拼音、通俗講法和通俗講法的同義詞。

9.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其特征在于：還包括根據(jù)輸出的正確文本信息更新客制化字典數(shù)據(jù)庫(kù)，所述客制化字典數(shù)據(jù)庫(kù)用于存儲(chǔ)用戶的習(xí)慣性詞。

10.基于用戶意圖分析的語(yǔ)音識(shí)別矯正系統(tǒng)，其特征在于：使用權(quán)利要求1-9任一所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法，其系統(tǒng)包括：

建立模塊，用于建立客制化字典數(shù)據(jù)庫(kù)；

獲取模塊，用于獲取用戶輸入的語(yǔ)音信息，并根據(jù)客制化字典數(shù)據(jù)庫(kù)轉(zhuǎn)化為文本信息；

意圖分析模塊，用于根據(jù)所述文本信息進(jìn)行意圖分析；

命名實(shí)體模塊，用于根據(jù)意圖分析結(jié)果使用基于神經(jīng)網(wǎng)絡(luò)的BERT+BILSTM+CRF模型進(jìn)行命名實(shí)體識(shí)別，并提取實(shí)體；

替換模塊，用于基于拼音及數(shù)據(jù)庫(kù)根據(jù)提取實(shí)體進(jìn)行錯(cuò)字替換；

其中，所述替換模塊包括轉(zhuǎn)化單元、匹配單元，所述轉(zhuǎn)化單元用于將提取實(shí)體和原文本信息轉(zhuǎn)化為拼音；所述匹配單元用于將提取實(shí)體的拼音與原文本信息的拼音進(jìn)行匹配，確認(rèn)正確字索引位置

輸出模塊，用于輸出正確文本信息；

更新模塊，用于根據(jù)輸出的正確文本信息更新客制化數(shù)據(jù)庫(kù)。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會(huì)員可以免費(fèi)下載。

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門萬(wàn)勢(shì)順易科技有限公司，未經(jīng)廈門萬(wàn)勢(shì)順易科技有限公司許可，擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請(qǐng)聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202111448714.5/1.html，轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

同類專利

專利分類

G 物理

G10 樂(lè)器；聲學(xué)
G10L 語(yǔ)音分析或合成；語(yǔ)音識(shí)別；音頻分析或處理
G10L15-00 語(yǔ)音識(shí)別
G10L15-02 .語(yǔ)音識(shí)別的特征提??；識(shí)別單位的選擇
G10L15-04 .分段或字極限檢測(cè)
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語(yǔ)音識(shí)別系統(tǒng)，例如對(duì)說(shuō)話者聲音特征的適應(yīng)
G10L15-08 .語(yǔ)音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級(jí)VIP會(huì)員，免費(fèi)下載

專利文獻(xiàn)下載

說(shuō)明：

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級(jí)中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級(jí)為極速版,下載速度顯著提升！歡迎使用！

請(qǐng)您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊(cè)】