[發明專利]一種基于語義相似度的問答系統及方法有效
| 申請號: | 201910514477.4 | 申請日: | 2019-06-12 |
| 公開(公告)號: | CN110362665B | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 張競堯;張文澤 | 申請(專利權)人: | 深圳追一科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518054 廣東省深圳市南山區粵海*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 相似 問答 系統 方法 | ||
本發明提供了一種基于語義相似度的問答系統及方法,該系統包括:客服接入端、客服處理端和標準問答庫;客服接入端,用于獲取用戶問句,并將用戶問句發送給客服處理端;客服處理端,用于將用戶問句輸入至預先訓練好的多任務深度學習模型以得到用戶問句的隱層向量,并根據用戶問句的隱層向量得到用戶問句對應的標準問,從標準問答庫中獲取與用戶問句對應的標準問相關聯的標準答,并將該標準答返回給客服接入端;標準問答庫,用于存儲多個標準問及與該多個標準問中的每個標準問相關聯的標準答。本發明實施例在降低了訓練數據需求量的情況下,仍然能夠保證智能問答系統對用戶問句分類的準確率和回復的準確率。
技術領域
本發明涉及語義識別技術領域,尤其涉及一種基于語義相似度的問答系統及方法。
背景技術
隨著互聯網絡的發展,借助于社交平臺的在線客服已在各個行業獲得廣泛應用,常見的例如:醫療、旅游、電商等等。為了在給客戶帶來良好服務體驗的同時,達到節約人力成本的目的,多數企業選擇了智能問答系統,因為,智能問答系統能用簡潔且準確的自然語言回答用戶提出的問題。相關技術中,常見的做法是將企業業務視為分類任務,預設一些標準問及標準問對應的標準問答案,然后采用深度學習模型對交互日志進行訓練,為每個客戶提供一套模型,將用戶問句輸入模型,經過模型預測命中概率最大的標準問,輸出該標準問對應的標準問答案。但是,基于深度學習的分類任務需要海量的訓練數據才能保證準確率,而企業業務啟動初期或中小企業卻難免面臨數據量過少的情況,無法構建成規模的訓練數據,這就導致用戶問句分類準確率降低,從而使得智能問答系統回復的準確率大大降低。
發明內容
本發明提供了一種基于語義相似度的問答系統及方法,以解決缺乏成規模的訓練數據的情況下,智能問答系統對用戶問句分類準確率降低,從而使得回復的準確率降低的問題。
根據本發明實施例的一方面,提供了一種基于語義相似度的問答系統,該系統包括客服接入端、客服處理端和標準問答庫;所述客服處理端包括深度學習模塊和問答匹配模塊;
所述客服接入端,用于獲取用戶問句,并將所述用戶問句發送給所述深度學習模塊;
所述深度學習模塊,用于將所述用戶問句輸入至預先訓練好的多任務深度學習模型以得到所述用戶問句的隱層向量,并根據所述用戶問句的隱層向量得到所述用戶問句對應的標準問,將所述用戶問句對應的標準問發送給所述問答匹配模塊;
所述問答匹配模塊,用于從所述標準問答庫中獲取與所述用戶問句對應的標準問相關聯的標準答,并將該標準答返回給所述客服接入端;
所述標準問答庫,用于存儲多個標準問及與該多個標準問中的每個標準問相關聯的標準答。
在一種可能的實施例中,所述深度學習模塊,包括:第一向量獲取單元,用于查詢預先保存的檢索矩陣以得到所述多個標準問中每個標準問的隱層向量;其中,所述檢索矩陣包括所述多個標準問中每個標準問的隱層向量;
匹配計算單元,用于計算所述用戶問句的隱層向量與所述多個標準問中每個標準問的隱層向量之間的第一余弦相似度;
結果獲取單元,用于根據所述第一余弦相似度確定出所述用戶問句對應的標準問。
在一種可能的實施例中,所述深度學習模塊還包括第二向量獲取單元和添加判斷單元;所述標準問答庫還用于接收待添加標準問,并將所述待添加標準問發送給所述深度學習模塊;
所述第二向量獲取單元,用于將所述待添加標準問輸入至所述多任務深度學習模型,以得到所述待添加標準問的隱層向量;
所述匹配計算單元,還用于計算所述待添加標準問的隱層向量與所述多個標準問中每個標準問的隱層向量之間的第二余弦相似度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳追一科技有限公司,未經深圳追一科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910514477.4/2.html,轉載請聲明來源鉆瓜專利網。





