[發明專利]一種融合知識庫與用戶建模的智能問答方法及系統有效
| 申請號: | 202010065407.8 | 申請日: | 2020-01-20 |
| 公開(公告)號: | CN111414461B | 公開(公告)日: | 2022-06-14 |
| 發明(設計)人: | 陳羽中;李超凡;郭昆;張睿 | 申請(專利權)人: | 福州大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06N3/04;G06N3/08 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 丘鴻超;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 融合 知識庫 用戶 建模 智能 問答 方法 系統 | ||
1.一種融合知識庫與用戶建模的智能問答方法,其特征在于,包括以下步驟:
步驟A:采集智能問答系統中的問題以及回答記錄,構建問答對訓練集QA;
智能問答系統中的每個問題及其回答記錄表示為一個問答序列q表示問題句子,{at|t=1,2,...,Nq}為問題q的答案集合,Nq為問題q對應的答案數量,問題q和答案集合中的每個答案at構成一個問答對(q,at),則問答對訓練集QA中每個問題的訓練樣本表示為
步驟B:采集智能問答系統中每個用戶對問題的回答記錄,構建用戶的歷史回答訓練集UA;
步驟C:基于問答對訓練集QA、用戶的歷史回答訓練集UA以及知識庫KB,訓練基于改進循環實體網絡Recurrent Entity Network的深度學習網絡模型;
步驟D:接收用戶的提問,并將提問輸入到訓練好的深度學習網絡模型中,輸出匹配的答案;
所述步驟C具體包括以下步驟:
步驟C1:對每個問答對(q,at),分別對問題q和答案at進行分詞處理并去除停用詞;
步驟C2:對每個問答對(q,at),分別獲取問題q和答案at的初始表征向量;
步驟C3:對每個問答對(q,at),分別獲取問題q和答案at的知識表征向量;
步驟C4:對每個問答對(q,at),融合步驟C2獲得的問題q的初始表征向量和步驟C3獲得的問題q的知識表征向量,得到問題q的帶知識嵌入的表征向量融合步驟C2獲得的答案at的初始表征向量和步驟C3獲得的答案at的知識表征向量,得到答案at的帶知識嵌入的表征向量
步驟C5:遍歷歷史回答訓練集UA,根據每個用戶的歷史回答集合,獲取每個用戶的歷史回答表征向量;
步驟C6:對每個問答對(q,at),得到提供答案at的用戶根據步驟C5獲得的每個用戶的歷史回答表征向量,查找得到用戶的歷史回答表征向量與步驟C4獲得的問題q和答案at的帶知識嵌入的表征向量共同構成一個三元組進而構成三元組序列輸入到深度學習網絡模型的基于循環實體網絡的動態記憶模塊中,得到問答對的帶知識嵌入以及用戶嵌入的表征向量;
步驟C7:將步驟C6得到的表征向量輸入到深度學習網絡模型的隱藏層和Softmax層,根據目標損失函數loss,利用反向傳播方法計算深度學習網絡中各參數的梯度,并利用隨機梯度下降方法更新參數;
步驟C8:當深度學習網絡模型產生的損失值小于設定閾值或者迭代次數達到最大迭代次數,則終止深度學習網絡模型的訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于福州大學,未經福州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010065407.8/1.html,轉載請聲明來源鉆瓜專利網。





