[發明專利]用戶意圖分析方法、裝置、電子設備及計算機存儲介質在審
| 申請號: | 202011302192.3 | 申請日: | 2020-11-19 |
| 公開(公告)號: | CN112380870A | 公開(公告)日: | 2021-02-19 |
| 發明(設計)人: | 李志韜;王健宗;程寧 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06N20/00 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 意圖 分析 方法 裝置 電子設備 計算機 存儲 介質 | ||
本發明涉及數據分析技術,揭露了一種用戶意圖分析方法,包括:獲取用戶的輸入文本,將所述輸入文本轉化為語義向量;對所述語義向量進行意圖預測,得到所述輸入文本的預測意圖標簽;利用特征提取網絡對所述預測意圖標簽進行特征提取,根據提取到的特征生成多個目標意圖;計算所述多個目標意圖中各目標意圖的優先度;根據所述優先度從所述多個目標意圖中選取預設數量的目標意圖為用戶意圖。此外,本發明還涉及區塊鏈技術,所述印章記錄可存儲于區塊鏈的節點。本發明還提出一種用戶意圖分析裝置、電子設備以及計算機可讀存儲介質。本發明可以提高識別用戶意圖的準確性。
技術領域
本發明涉及數據分析技術領域,尤其涉及一種用戶意圖分析方法、裝置、電子設備及計算機可讀存儲介質。
背景技術
隨著智能客服的廣泛應用,越來越多的公司或企業使用智能機器人對用戶的提問進行自動答復。自動答復過程中,如何根據用戶的提問準確地識別出用戶的意圖是越來越被人們所關注的重點。
現有的自動答復過程中對用戶意圖進行識別的方法多為基于相似度算法計算用戶的提問與預先設定的標準提問的相似度,以根據相似度識別出用戶提問的意圖。但由于不同用戶的語言表達習慣不一致,因此對于同一意圖,不同的用戶在表達上差異較大,導致了現有方法在利用相似度識別用戶意圖時的識別精確度不高。
發明內容
本發明提供一種用戶意圖分析方法、裝置及計算機可讀存儲介質,其主要目的在于解決對用戶意圖進行識別的精確性不高的問題。
為實現上述目的,本發明提供的一種用戶意圖分析方法,包括:
獲取用戶的輸入文本,將所述輸入文本轉化為語義向量;
對所述語義向量進行意圖預測,得到所述輸入文本的預測意圖標簽;
利用特征提取網絡對所述預測意圖標簽進行特征提取,根據提取到的特征生成多個目標意圖;
計算所述多個目標意圖中各目標意圖的優先度;
根據所述優先度從所述多個目標意圖中選取預設數量的目標意圖為用戶意圖。
可選地,所述將所述輸入文本轉化為語義向量,包括:
構建文本向量化模型;
獲取歷史文本,對所述歷史文本進行預設實體標記,得到訓練文本;
利用所述訓練文本對所述文本向量化模型進行迭代訓練,直至所述文本向量化模型收斂,得到訓練完成的文本向量化模型;
利用訓練完成的文本向量化模型對所述輸入文本進行轉化,得到所述輸入文本的語義向量。
可選地,所述對所述歷史文本進行預設實體標記,得到訓練文本,包括:
根據預設實體構建包含非預設實體字符標簽、預設實體開始字符標簽、預設實體中間字符標簽的標簽集合;
利用所述標簽集合中的標簽對所述歷史文本中的每個字符進行標記,得到訓練文本。
可選地,所述利用所述訓練文本對所述文本向量化模型進行迭代訓練,直至所述文本向量化模型收斂,包括:
將所述訓練文本輸入至所述文本向量化模型進行向量轉化,得到預測文本向量;
獲取所述訓練文本對應的標準文本向量;
計算所述預測文本向量與所述標準文本向量之間的損失值,當所述損失值小于預設損失閾值時,確定所述文本向量化模型收斂。
可選地,所述利用特征提取網絡對所述預測意圖標簽進行特征提取,包括:
通過特征提取網絡的可視層標記所述預測意圖標簽的數據表征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011302192.3/2.html,轉載請聲明來源鉆瓜專利網。





