[發(fā)明專利]基于概念樹的意圖識別方法、裝置及計算機設(shè)備有效
| 申請?zhí)枺?/td> | 201811285537.1 | 申請日: | 2018-10-31 |
| 公開(公告)號: | CN109492222B | 公開(公告)日: | 2023-04-07 |
| 發(fā)明(設(shè)計)人: | 嚴海銳;周寶;王健宗;肖京 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/289 | 分類號: | G06F40/289;G06N3/008;G06N20/00 |
| 代理公司: | 北京英特普羅知識產(chǎn)權(quán)代理有限公司 11015 | 代理人: | 林彥之 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 概念 意圖 識別 方法 裝置 計算機 設(shè)備 | ||
1.一種基于概念樹的意圖識別方法,其特征在于,包括以下步驟:
步驟01,獲取需要進行意圖識別的目標語句;
步驟02,對所述目標語句進行分詞處理,得到至少一個遍歷詞;
步驟03,針對每一個當前遍歷詞,對預(yù)先構(gòu)建的概念樹中每一個意圖對應(yīng)的關(guān)鍵詞進行遍歷,并計算當前遍歷詞與遍歷到的每一個關(guān)鍵詞的詞向量相似度;其中,所述概念樹包括至少一個層,每一個層包括至少一個意圖,每一個意圖對應(yīng)至少一個關(guān)鍵詞,每一個關(guān)鍵詞設(shè)置有相應(yīng)的權(quán)值;所述概念樹中第N+1層為第N層的子意圖,所述概念樹中第N層為第N+1層的父意圖,N為正整數(shù);
步驟04,根據(jù)當前遍歷詞與遍歷到的每一個關(guān)鍵詞的詞向量相似度,以及遍歷到的每一個關(guān)鍵詞對應(yīng)的權(quán)值,計算所述目標語句在每一個意圖對應(yīng)的意圖分值;
步驟05,根據(jù)所述目標語句在每一個意圖上對應(yīng)的意圖分值,以及預(yù)先設(shè)置的每一個層對應(yīng)的意圖閾值,確定所述目標語句對應(yīng)的意圖;
所述概念樹按照如下方式構(gòu)建:
步驟001,確定用于構(gòu)建所述概念樹第N層的各個意圖;
步驟002,獲取各個意圖分別對應(yīng)的數(shù)據(jù)樣本;
步驟003,針對每一個意圖,將對應(yīng)的數(shù)據(jù)樣本進行分詞處理,得到該意圖對應(yīng)的至少一個待選詞,在至少一個待選詞中選擇該意圖對應(yīng)的關(guān)鍵詞;
步驟004,確定每一個關(guān)鍵詞對應(yīng)的權(quán)值,將確定的權(quán)值配置給相應(yīng)的關(guān)鍵詞;
步驟005,判斷每一個當前意圖是否包括子意圖,若包括子意圖,則確定用于構(gòu)建所述概念樹第N+1層的各個子意圖,并針對各個子意圖執(zhí)行步驟002-005,若不包括子意圖,則所述概念樹構(gòu)建完成;
所述步驟04中計算所述目標語句在每一個意圖上對應(yīng)的意圖分值通過如下公式計算:
其中,S用于表征所述目標語句在當前意圖上對應(yīng)的意圖分值;m用于表征遍歷詞的總個數(shù);Si用于表征第i個遍歷詞在當前意圖上對應(yīng)的意圖分值;n用于表征當前意圖對應(yīng)關(guān)鍵詞的總個數(shù),Pij用于表征第i個遍歷詞與當前意圖對應(yīng)的第j個關(guān)鍵詞的詞向量相似度,Qj用于表征當前意圖對應(yīng)的第j個關(guān)鍵詞的權(quán)值。
2.根據(jù)權(quán)利要求1所述的基于概念樹的意圖識別方法,其特征在于,所述在至少一個待選詞中選擇該意圖對應(yīng)的關(guān)鍵詞,包括:針對每一個待選詞進行TF-IDF計算,根據(jù)待選詞的TF-IDF值選取關(guān)鍵詞。
3.根據(jù)權(quán)利要求1所述的基于概念樹的意圖識別方法,其特征在于,
方法還包括:預(yù)先配置詞列表;所述詞列表中包括若干個無實質(zhì)含義的詞;
在步驟03之前,還包括:將得到的至少一個遍歷詞中位于所述詞列表中的遍歷詞刪除,并針對刪除操作后剩余的至少一個遍歷詞執(zhí)行步驟03。
4.根據(jù)權(quán)利要求1所述的基于概念樹的意圖識別方法,其特征在于,在Pij的值小于設(shè)定的相似度閾值時,則Pij*Qj=0。
5.根據(jù)權(quán)利要求1-4中任一所述的基于概念樹的意圖識別方法,其特征在于,所述步驟05包括:
步驟051:針對當前層,確定當前層上意圖分值最高的目標意圖;
步驟052:判斷所述目標意圖的意圖分值是否大于所屬層對應(yīng)的意圖閾值,若是,執(zhí)行步驟053;若否,執(zhí)行步驟056;
步驟053:判斷所述目標意圖是否包括子意圖,若所述目標意圖包括子意圖,執(zhí)行步驟054;若所述目標意圖不包括子意圖,則執(zhí)行步驟055;
步驟054:確定所述目標意圖包括的子意圖中意圖分值最高的目標子意圖,將所述目標子意圖作為所述目標意圖執(zhí)行步驟052;
步驟055:將所述目標意圖確定為所述目標語句對應(yīng)的意圖,結(jié)束;
步驟056:判斷所述目標意圖是否包括父意圖,若包括,則執(zhí)行步驟057;若不包括,則執(zhí)行步驟058;
步驟057:將所述目標意圖對應(yīng)的父意圖確定為所述目標語句對應(yīng)的意圖,結(jié)束;
步驟058:確定所述目標語句沒有意圖,結(jié)束。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811285537.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于意圖挖掘的方法和設(shè)備
- 意圖估計裝置以及意圖估計方法
- 意圖識別方法、裝置、設(shè)備及計算機可讀介質(zhì)
- 意圖確認方法及裝置
- 搜索意圖識別方法、裝置、電子設(shè)備和存儲介質(zhì)
- 語句多意圖識別方法、系統(tǒng)、電子設(shè)備及存儲介質(zhì)
- 對話系統(tǒng)中意圖沖突的解決方法、系統(tǒng)及裝置
- 信息通信網(wǎng)絡(luò)的意圖轉(zhuǎn)譯方法、系統(tǒng)、介質(zhì)及交互接口
- 語音對話的意圖識別方法、系統(tǒng)、設(shè)備及存儲介質(zhì)
- 意圖識別方法、裝置、電子設(shè)備及可讀存儲介質(zhì)





