[發明專利]問答模型及應答語句的生成方法、裝置、介質和電子設備有效
| 申請號: | 201811114567.6 | 申請日: | 2018-09-25 |
| 公開(公告)號: | CN110209782B | 公開(公告)日: | 2023-08-25 |
| 發明(設計)人: | 繆暢宇 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/35 |
| 代理公司: | 深圳市聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 問答 模型 應答 語句 生成 方法 裝置 介質 電子設備 | ||
1.一種應答語句的生成方法,其特征在于,包括:
從第一數據庫中抽取問題與領域的樣本數據,以及問題與關鍵詞的樣本數據;
基于注意力機制,并通過所述問題與領域的樣本數據,以及所述問題與關鍵詞的樣本數據對深度神經網絡模型進行訓練,得到問題分類模型和關鍵詞提取模型,所述問題分類模型用于確定問題所屬領域,所述關鍵詞提取模型用于提取問題中與領域相關的關鍵詞;
從第二數據庫中分別抽取問題數據和所述問題數據對應的應答數據;
將所述問題數據輸入至所述關鍵詞提取模型,通過所述關鍵詞提取模型得到所述問題數據所包含的關鍵詞;
將所述問題數據對應的應答數據輸入至所述問題分類模型,通過所述問題分類模型得到所述問題數據所屬的領域;
根據所述關鍵詞和所述領域,獲取所述問題數據的相關資料數據;
基于所述問題數據、所述問題數據的相關資料數據和所述問題數據對應的應答數據生成訓練樣本,并基于所述訓練樣本對模型文件進行訓練,以生成問答模型;
將接收到的待處理的問題語句分別通過所述關鍵詞提取模型以及所述問題分類模型,得到所述問題語句所包含的關鍵詞及所述問題語句所屬的領域;
根據所述問題語句所包含的關鍵詞及所述問題語句所屬的領域,獲取所述問題語句的相關資料數據;
將所述問題語句和所述問題語句的相關資料數據輸入至所述問答模型中,通過所述問答模型得到所述問題語句對應的應答語句。
2.根據權利要求1所述的應答語句的生成方法,其特征在于,根據所述問題語句所包含的關鍵詞及所述問題語句所屬的領域,獲取所述問題語句的相關資料數據,包括:
根據所述問題語句所包含的關鍵詞,在屬于所述領域的資料數據中檢索與所述關鍵詞相關的資料數據,并將檢索到的資料數據作為所述問題語句的相關資料數據。
3.根據權利要求1或2所述的應答語句的生成方法,其特征在于,還包括:
在生成所述問題語句對應的應答語句之后,存儲所述問題語句及所述問題語句對應的應答語句。
4.根據權利要求3所述的應答語句的生成方法,其特征在于,存儲所述問題語句及所述問題語句對應的應答語句,包括:
若已存儲有所述問題語句,則通過所述問題語句對應的應答語句更新存儲的所述問題語句的相關信息;
若未存儲有所述問題語句,則新建所述問題語句對應的記錄,以存儲所述問題語句及所述問題語句對應的應答語句。
5.根據權利要求3所述的應答語句的生成方法,其特征在于,在存儲所述問題語句及所述問題語句對應的應答語句之后,還包括:
通過存儲的問題語句及所述問題語句對應的應答語句對所述問題模型進行優化處理。
6.一種應答語句的生成裝置,其特征在于,包括:
確定單元,用于從第一數據庫中抽取問題與領域的樣本數據,以及問題與關鍵詞的樣本數據;基于注意力機制,并通過所述問題與領域的樣本數據,以及所述問題與關鍵詞的樣本數據對深度神經網絡模型進行訓練,得到問題分類模型和關鍵詞提取模型,所述問題分類模型用于確定問題所屬領域,所述關鍵詞提取模型用于提取問題中與領域相關的關鍵詞;從第二數據庫中分別抽取問題數據和所述問題數據對應的應答數據;將所述問題數據輸入至所述關鍵詞提取模型,通過所述關鍵詞提取模型得到所述問題數據所包含的關鍵詞;將所述問題數據對應的應答數據輸入至所述問題分類模型,通過所述問題分類模型得到所述問題數據所屬的領域;根據所述關鍵詞和所述領域,獲取所述問題數據的相關資料數據;基于所述問題數據、所述問題數據的相關資料數據和所述問題數據對應的應答數據生成訓練樣本,并基于所述訓練樣本對模型文件進行訓練,以生成問答模型;將接收到的待處理的問題語句分別通過所述關鍵詞提取模型以及所述問題分類模型,得到所述問題語句所包含的關鍵詞及所述問題語句所屬的領域;
獲取單元,用于根據所述問題語句所包含的關鍵詞及所述問題語句所屬的領域,獲取所述問題語句的相關資料數據;
生成單元,用于將所述問題語句和所述問題語句的相關資料數據輸入至所述問答模型中,通過所述問答模型得到所述問題語句對應的應答語句。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811114567.6/1.html,轉載請聲明來源鉆瓜專利網。





