[發(fā)明專利]一種用戶意圖識別方法、裝置和計(jì)算機(jī)設(shè)備在審
| 申請?zhí)枺?/td> | 202110933016.8 | 申請日: | 2021-08-13 |
| 公開(公告)號: | CN113569578A | 公開(公告)日: | 2021-10-29 |
| 發(fā)明(設(shè)計(jì))人: | 徐國興 | 申請(專利權(quán))人: | 上海淇玥信息技術(shù)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/284;G06F40/211;G06K9/62 |
| 代理公司: | 北京清誠知識產(chǎn)權(quán)代理有限公司 11691 | 代理人: | 喬東峰 |
| 地址: | 201500 上海市崇明*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用戶 意圖 識別 方法 裝置 計(jì)算機(jī) 設(shè)備 | ||
1.一種用于智能語音機(jī)器人的用戶意圖識別方法,其特征在于,包括:
從所述智能語音機(jī)器人與用戶之間的歷史問答文本中,提取候選特征詞,基于所述候選特征詞建立特征數(shù)據(jù)庫;
構(gòu)建多個(gè)意圖識別模型,所述多個(gè)意圖識別模型均包括在訓(xùn)練過程中更新模型參數(shù);
獲取待處理用戶語音文本,確定相應(yīng)的意圖識別模型;
使用所確定的意圖識別模型,輸出所述待處理用戶語音文本的意圖預(yù)測值。
2.根據(jù)權(quán)利要求1所述的用戶意圖識別方法,其特征在于,所述在訓(xùn)練過程中更新模型參數(shù)包括:
在特定特征詞的語義統(tǒng)一性大于設(shè)定值,且所述特定特征詞的歧義消解的準(zhǔn)確率大于特定值時(shí),停止對所述多個(gè)意圖識別模型進(jìn)行訓(xùn)練。
3.根據(jù)權(quán)利要求2所述的用戶意圖識別方法,其特征在于,還包括:
從所述候選特征詞中選擇與不同互聯(lián)網(wǎng)服務(wù)場景的特定特征詞,所述特定特征詞包括違約、逾期、延期、詢問、互聯(lián)網(wǎng)資源歸還時(shí)間、互聯(lián)網(wǎng)資源歸還方式,以及與互聯(lián)網(wǎng)資源服務(wù)申請、認(rèn)證、使用或催收相關(guān)的特征詞。
4.根據(jù)權(quán)利要求1或2所述的用戶意圖識別方法,其特征在于,所述確定相應(yīng)的意圖識別模型包括:
對所獲取的待處理用戶語音文本進(jìn)行分詞,得到各詞項(xiàng);
根據(jù)各詞項(xiàng),判斷問答類別,以確定與所述問答類別相對應(yīng)的意圖識別模型。
5.根據(jù)權(quán)利要求1所述的用戶意圖識別方法,其特征在于,所述提取候選特征詞包括:
使用TF-IDF方法,對候選特征詞進(jìn)行提??;
計(jì)算每一個(gè)候選特征詞的貢獻(xiàn)度,確定候選特征詞的權(quán)重,以選出特定特征詞。
6.根據(jù)權(quán)利要求1或5所述的用戶意圖識別方法,其特征在于,所述基于所述候選特征詞建立特征數(shù)據(jù)庫包括:
所述特征數(shù)據(jù)庫包括從候選特征詞中選出的特定特征詞、包含特定特征詞的文本句以及文本句的句向量,該文本句包括不同語義結(jié)構(gòu)的多個(gè)歧義句。
7.根據(jù)權(quán)利要求6所述的用戶意圖識別方法,其特征在于,所述建立特征數(shù)據(jù)庫還包括:
計(jì)算所述多個(gè)歧義句的句向量,以及所述特定特征詞對各歧義句的貢獻(xiàn)度,并使用該貢獻(xiàn)度作為所述特定特征詞在各歧義句的權(quán)重系數(shù)。
8.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的用戶意圖識別方法,其特征在于,
對所獲取的待處理用戶語音文本進(jìn)行分詞處理、向量轉(zhuǎn)換,得到多個(gè)詞項(xiàng)和待處理句向量;
將所述待處理句向量與所述特征數(shù)據(jù)庫中的句向量進(jìn)行相似度計(jì)算,確定與待處理用戶語音文本相似的歧義句、各詞項(xiàng)中特定特征詞的貢獻(xiàn)度;和/或
根據(jù)所輸出的意圖預(yù)測值,以及所述待處理用戶語音文本的特定特征詞的貢獻(xiàn)度,確定與所述待處理用戶語音文本相對應(yīng)的回復(fù)句,所述意圖預(yù)測值用于表征用戶意圖的概率。
9.一種用于智能語音機(jī)器人的用戶意圖識別裝置,其特征在于,包括:
提取處理模塊,用于從所述智能語音機(jī)器人與用戶之間的歷史問答文本中,提取候選特征詞,基于所述候選特征詞建立特征數(shù)據(jù)庫;
模型構(gòu)建模塊,用于構(gòu)建多個(gè)意圖識別模型,所述多個(gè)意圖識別模型均包括在訓(xùn)練過程中更新模型參數(shù);
模型確定模塊,用于獲取待處理用戶語音文本,確定相應(yīng)的意圖識別模型;
輸出模塊,用于使用所確定的意圖識別模型,輸出所述待處理用戶語音文本的意圖預(yù)測值。
10.根據(jù)權(quán)利要求9所述的用戶意圖識別裝置,其特征在于,還包括參數(shù)更新模塊,所述參數(shù)更新模塊用于在特定特征詞的語義統(tǒng)一性大于設(shè)定值,且所述特定特征詞的歧義消解的準(zhǔn)確率大于特定值時(shí),停止對所述多個(gè)意圖識別模型進(jìn)行訓(xùn)練;
模型確定模塊,具體用于對所獲取的待處理用戶語音文本進(jìn)行分詞,得到各詞項(xiàng);根據(jù)各詞項(xiàng),判斷問答類別,以確定與所述問答類別相對應(yīng)的意圖識別模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海淇玥信息技術(shù)有限公司,未經(jīng)上海淇玥信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110933016.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計(jì)裝置以及意圖估計(jì)方法
- 意圖識別方法、裝置、設(shè)備及計(jì)算機(jī)可讀介質(zhì)
- 意圖確認(rèn)方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





