[發明專利]文本意圖識別方法、裝置、設備和存儲介質在審
| 申請號: | 202010033742.X | 申請日: | 2020-01-13 |
| 公開(公告)號: | CN111221944A | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 李小娟;徐國強 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F16/332;G06F40/30;G06N3/04 |
| 代理公司: | 北京市京大律師事務所 11321 | 代理人: | 劉挽瀾 |
| 地址: | 518033 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本 意圖 識別 方法 裝置 設備 存儲 介質 | ||
本發明涉及人工智能領域,提供一種文本意圖識別方法、裝置、設備和存儲介質。方法包括:獲取待處理的文本信息以及數據庫所存儲的多個標準句子;計算多個待處理的文本信息的特征值以及獲取數據庫所存儲的多個標準句子的特征值;通過多個標準句子的特征值以及獲取待處理的文本信息的特征值計算多個第一相似度,并提取最大的第一相似度,得到第一目標相似度;判斷第一目標相似度是否小于閾值;若第一目標相似度小于閾值,則將多個標準句子的特征值以及待處理的文本信息的特征值輸入至目標神經網絡模型,通過目標神經網絡模型輸出第二相似度集合;通過提取所述第二相似度集合中的元素,得到用戶的最終意圖。加快深度文本匹配的效率。
技術領域
本發明涉及語音語義領域,尤其涉及一種文本意圖識別方法、裝置、設備和存儲介質。
背景技術
智能對話是一種使用自然語言與用戶交互的人工智能系統,通過對用戶意圖分析和理解來達到對話的目的。系統理解人類所傳遞的信息并轉化為一種內部狀態,然后根據對話狀態策略采取相應的行為,最后轉化為人類可以理解的自然語言。傳統的文本匹配方法是基于字面的相似度計算,而對于基于語義匹配,如:“Iphone多少錢”和“蘋果手機什么價格”則基本無能為力。其次,除了計算消息-候選回復之間的相似度,意圖識別也常常使用文本分類的方式。但分類模型屬于有監督訓練,不僅需要人工標注訓練集,對于數據類別的平衡性要求也比較高。再者,對于特定的文本匹配需求,比如“我的支付寶借唄開通了”和“我的支付寶借唄沒有開通”,從字面意思上,具有極高的特征相似性,極容易被判定為相同的意圖,但這種語句相似但意思截然相反的情況,在實際的對話系統中出現的頻率極高且很難通過常規的文本匹配來解決,導致意圖識別的準確度低。
發明內容
本發明提供了一種通過配置文本意圖識別方法,能夠提高了機器識別文本意圖的準確度。
第一方面,本發明提供一種文本意圖識別方法,包括:
獲取待處理的文本信息以及數據庫所存儲的多個標準句子;
計算所述多個待處理的文本信息的特征值以及獲取所述數據庫所存儲的多個標準句子的特征值;
通過所述多個標準句子的特征值以及獲取所述待處理的文本信息的特征值計算多個第一相似度,得到第一相似度集合;
提取所述第一相似度集合中最大的所述第一相似度,得到第一目標相似度;
判斷所述第一目標相似度是否小于閾值;
若所述第一目標相似度小于閾值,則將所述多個標準句子的特征值以及所述待處理的文本信息的特征值輸入至目標神經網絡模型,通過所述目標神經網絡模型輸出第二相似度集合,所述目標神經網絡模型為長短期記憶模型、注意力模型、雙向長短期記憶BiLSTM模型以及軟最大值Softmax層串聯而成的神經網絡;
通過提取所述第二相似度集合中的元素,得到用戶的最終意圖。
在一些可能的設計中,所述若所述第一目標相似度小于閾值,則將所述多個標準句子的特征值以及所述待處理的文本信息的特征值輸入至目標神經網絡模型,通過所述目標神經網絡模型輸出第二相似度集合,包括:
獲取所述待處理的文本信息以及所述數據庫所存儲的多個標準句子,得到第一矩陣a以及第二矩陣b的集合;
分別將每個所述第二矩陣b與所述第一矩陣a組合成輸入信息,將所述輸入信息輸入至第一神經網絡,得到多個所述第一神經網絡的第一輸出矩陣和所述第一神經網絡的第二輸出矩陣所述第一神經網絡模型是指長短期記憶模型;
將所述多個和輸入至第二神經網絡模型,得到所述第二神經網絡的第一輸出矩陣和所述第二神經網絡的第二輸出矩陣所述第二神經網絡模型是指注意力Attention模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010033742.X/2.html,轉載請聲明來源鉆瓜專利網。





