[發明專利]一種基于語義相似度的問答系統及方法有效
| 申請號: | 201910514477.4 | 申請日: | 2019-06-12 |
| 公開(公告)號: | CN110362665B | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 張競堯;張文澤 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518054 廣東省深圳市南山區粵海*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 相似 問答 系統 方法 | ||
1.一種基于語義相似度的問答系統,其特征在于,所述系統包括客服接入端、客服處理端和標準問答庫;所述客服處理端包括深度學習模塊和問答匹配模塊;所述深度學習模塊包括第一向量獲取單元、匹配計算單元和結果獲取單元;
所述客服接入端,用于獲取用戶問句,并將所述用戶問句發送給所述深度學習模塊;
所述深度學習模塊,用于將所述用戶問句輸入至預先訓練好的多任務深度學習模型以得到所述用戶問句的隱層向量,并根據所述用戶問句的隱層向量得到所述用戶問句對應的標準問,將所述用戶問句對應的標準問發送給所述問答匹配模塊;所述多任務深度學習模型利用不同行業不同領域的業務數據訓練得到;
所述問答匹配模塊,用于從所述標準問答庫中獲取與所述用戶問句對應的標準問相關聯的標準答,并將該標準答返回給所述客服接入端;
所述標準問答庫,用于存儲多個標準問及與該多個標準問中的每個標準問相關聯的標準答;
所述深度學習模塊還包括第二向量獲取單元和添加判斷單元;所述標準問答庫還用于接收待添加標準問,并將所述待添加標準問發送給所述深度學習模塊;
所述第二向量獲取單元,用于將所述待添加標準問輸入至所述多任務深度學習模型,以得到所述待添加標準問的隱層向量;
所述匹配計算單元,還用于計算所述待添加標準問的隱層向量與所述多個標準問中每個標準問的隱層向量之間的第二余弦相似度;
所述添加判斷單元,用于若所述標準問答庫中不存在所述第二余弦相似度大于預設閾值的目標標準問,則允許在所述標準問答庫添加所述待添加標準問;若所述標準問答庫中存在所述第二余弦相似度大于預設閾值的目標標準問,則判斷所述標準問答庫中是否還存在所述第二余弦相似度大于所述待添加標準問與所述目標標準問之間的第二余弦相似度的標準問,若不存在則允許在所述標準問答庫添加所述待添加標準問,否則拒絕添加;所述目標標準問與所述待添加標準問指向同一業務;
所述第一向量獲取單元,用于查詢預先保存的檢索矩陣以得到所述多個標準問中每個標準問的隱層向量;其中,所述檢索矩陣包括所述多個標準問中每個標準問的隱層向量;
所述匹配計算單元,用于計算所述用戶問句的隱層向量與所述多個標準問中每個標準問的隱層向量之間的第一余弦相似度;
所述結果獲取單元,用于根據所述第一余弦相似度確定出所述用戶問句對應的標準問;
所述深度學習模塊還用于:
將所述多個標準問中的每個標準問輸入至所述多任務深度學習模型,以得到所述多個標準問中的每個標準問的隱層向量;
根據所述多個標準問中的每個標準問的隱層向量得到所述檢索矩陣并保存。
2.根據權利要求1所述的系統,其特征在于,所述深度學習模塊,還用于:
獲取多組客服服務日志數據,每組客服服務日志數據包括多個歷史用戶問句及對應的歷史標準問;
對所述多組客服服務日志數據進行深度學習訓練,得到所述多任務深度學習模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910514477.4/1.html,轉載請聲明來源鉆瓜專利網。





