[發(fā)明專利]基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法及其系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 202111448714.5 | 申請(qǐng)日: | 2021-12-01 |
| 公開(kāi)(公告)號(hào): | CN114333788A | 公開(kāi)(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計(jì))人: | 游海濤;吳昊 | 申請(qǐng)(專利權(quán))人: | 廈門萬(wàn)勢(shì)順易科技有限公司 |
| 主分類號(hào): | G10L15/06 | 分類號(hào): | G10L15/06;G10L15/22;G10L15/26;G06F16/35;G06F40/242;G06F40/295 |
| 代理公司: | 北京權(quán)智天下知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11638 | 代理人: | 余喜娣 |
| 地址: | 361000 福建省廈門市思*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 用戶 意圖 分析 語(yǔ)音 識(shí)別 矯正 方法 及其 系統(tǒng) | ||
1.基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于,包括以下方法:
S1、建立客制化字典數(shù)據(jù)庫(kù);
S2、獲取用戶輸入的語(yǔ)音信息,并根據(jù)客制化字典數(shù)據(jù)庫(kù)轉(zhuǎn)化為文本信息;
S3、根據(jù)所述文本信息進(jìn)行意圖分析;
S4、根據(jù)意圖分析結(jié)果使用基于神經(jīng)網(wǎng)絡(luò)的BERT+BILSTM+CRF模型進(jìn)行命名實(shí)體識(shí)別,并提取實(shí)體;
S5、基于拼音及數(shù)據(jù)庫(kù)根據(jù)提取實(shí)體進(jìn)行錯(cuò)字替換,并輸出正確文本信息。
2.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:所述意圖分析包括純語(yǔ)音信息識(shí)別、刪除語(yǔ)音信息、編輯語(yǔ)音信息中的一種或多種,其中所述刪除語(yǔ)音信息包括:根據(jù)不同情景,進(jìn)行實(shí)體提取,指定語(yǔ)句刪除。
3.根據(jù)權(quán)利要求2所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:當(dāng)意圖分析為編輯語(yǔ)音信息或刪除語(yǔ)音信息,則進(jìn)入命名實(shí)體識(shí)別和提取;反之,則進(jìn)行純語(yǔ)音信息識(shí)別。
4.根據(jù)權(quán)利要求3所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:所述意圖分析采用bert文本分類模型,將句子中的單字word embedding輸入bert文本分類模型預(yù)測(cè)句子的類別,且當(dāng)softmax層后的三個(gè)意圖的預(yù)測(cè)概率中最大值不到88%時(shí),則本句的意圖為純語(yǔ)音信息識(shí)別;若在此情況下確實(shí)想表達(dá)的是編輯語(yǔ)音信息或刪除語(yǔ)音信息,則說(shuō)明文本意圖不夠明顯,需換一種邏輯重新說(shuō)明。
5.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:所述命名實(shí)體包括必填詞槽、非必填詞槽,所述必填詞槽包括被修正字、線索詞組、組成成分中的一種或多種;所述非必填詞槽包括組成成分詞組、被修正字詞組、指定序數(shù)詞中的一種或多種。
6.根據(jù)權(quán)利要求5所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:所述步驟S5中基于拼音及數(shù)據(jù)庫(kù)根據(jù)提取實(shí)體進(jìn)行錯(cuò)字替換包括:
將提取實(shí)體和待處理文本信息轉(zhuǎn)化為拼音,并進(jìn)行匹配;
根據(jù)匹配結(jié)果確認(rèn)正確字索引位置;
索引字正規(guī)化,并將文本信息中的索引字替換為正確字。
7.根據(jù)權(quán)利要求6所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:在進(jìn)行匹配前,當(dāng)不存在修正字詞組時(shí),直接匹配得到正確字索引;當(dāng)存在修正字詞組時(shí),先使用修正字詞組匹配待選位置索引,再使用被修正字拼音在待索引里匹配位置索引。
8.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:所述步驟S5中數(shù)據(jù)庫(kù)包括新華字典數(shù)據(jù)庫(kù),所述新華字典數(shù)據(jù)庫(kù)為復(fù)合多元庫(kù),包括按中國(guó)拼音常用分析結(jié)果的詞頻順序排列、以及每個(gè)字包含其拼音和組成成分,而所述組成成分包含其拼音、通俗講法和通俗講法的同義詞。
9.根據(jù)權(quán)利要求1所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其特征在于:還包括根據(jù)輸出的正確文本信息更新客制化字典數(shù)據(jù)庫(kù),所述客制化字典數(shù)據(jù)庫(kù)用于存儲(chǔ)用戶的習(xí)慣性詞。
10.基于用戶意圖分析的語(yǔ)音識(shí)別矯正系統(tǒng),其特征在于:使用權(quán)利要求1-9任一所述的基于用戶意圖分析的語(yǔ)音識(shí)別矯正方法,其系統(tǒng)包括:
建立模塊,用于建立客制化字典數(shù)據(jù)庫(kù);
獲取模塊,用于獲取用戶輸入的語(yǔ)音信息,并根據(jù)客制化字典數(shù)據(jù)庫(kù)轉(zhuǎn)化為文本信息;
意圖分析模塊,用于根據(jù)所述文本信息進(jìn)行意圖分析;
命名實(shí)體模塊,用于根據(jù)意圖分析結(jié)果使用基于神經(jīng)網(wǎng)絡(luò)的BERT+BILSTM+CRF模型進(jìn)行命名實(shí)體識(shí)別,并提取實(shí)體;
替換模塊,用于基于拼音及數(shù)據(jù)庫(kù)根據(jù)提取實(shí)體進(jìn)行錯(cuò)字替換;
其中,所述替換模塊包括轉(zhuǎn)化單元、匹配單元,所述轉(zhuǎn)化單元用于將提取實(shí)體和原文本信息轉(zhuǎn)化為拼音;所述匹配單元用于將提取實(shí)體的拼音與原文本信息的拼音進(jìn)行匹配,確認(rèn)正確字索引位置
輸出模塊,用于輸出正確文本信息;
更新模塊,用于根據(jù)輸出的正確文本信息更新客制化數(shù)據(jù)庫(kù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廈門萬(wàn)勢(shì)順易科技有限公司,未經(jīng)廈門萬(wàn)勢(shì)順易科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111448714.5/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計(jì)裝置以及意圖估計(jì)方法
- 意圖識(shí)別方法、裝置、設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 意圖確認(rèn)方法及裝置
- 搜索意圖識(shí)別方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 語(yǔ)句多意圖識(shí)別方法、系統(tǒng)、電子設(shè)備及存儲(chǔ)介質(zhì)
- 對(duì)話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語(yǔ)音對(duì)話的意圖識(shí)別方法、系統(tǒng)、設(shè)備及存儲(chǔ)介質(zhì)
- 意圖識(shí)別方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)





