[發(fā)明專利]一種自動問答方法、裝置及存儲介質有效
| 申請?zhí)枺?/td> | 201710872147.3 | 申請日: | 2017-09-25 |
| 公開(公告)號: | CN108304437B | 公開(公告)日: | 2020-01-31 |
| 發(fā)明(設計)人: | 張想;馮啟航;柯玉耿;林強 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/31;G06F16/335 |
| 代理公司: | 44300 深圳翼盛智成知識產權事務所(普通合伙) | 代理人: | 黃威 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索問題 候選答案 存儲介質 倒排索引 自動問答 詞組 答案 集合 聊天機器人 目標答案 社交平臺 社交數(shù)據(jù) 系統(tǒng)輸出 匹配 輸出 | ||
1.一種自動問答方法,其特征在于,包括:
基于社交平臺上的社交數(shù)據(jù)形成的多個問答對,所述問答對包括問題及其對應的答案;
建立所述問題與其詞組的倒排索引;
獲取檢索問題,并根據(jù)所述檢索問題的問題詞組以及所述倒排索引確定與所述檢索問題相近的相近問題;
根據(jù)所述相近問題以及所述問答對獲取檢索問題的候選答案,得到檢索問題的候選答案集合;
獲取檢索問題中問題詞組的問題出現(xiàn)次數(shù),以及候選答案中答案詞的問題答案共現(xiàn)次數(shù);所述問題出現(xiàn)次數(shù)為問題詞組在問答對中出現(xiàn)的次數(shù),所述問題答案共現(xiàn)次數(shù)為候選答案中的答案詞組和檢索問題中的問題詞組在問題對中兩兩共現(xiàn)的次數(shù);
根據(jù)檢索問題中問題詞組的問題出現(xiàn)次數(shù)、以及答案中候選答案詞的問題答案共現(xiàn)次數(shù),從所述候選答案集合中選取所述檢索問題的目標答案。
2.如權利要求1所述的自動問答方法,其特征在于,從所述候選答案集合中選取所述檢索問題的目標答案,包括:
獲取候選答案集合中候選答案與檢索問題之間的句子相似度信息;
根據(jù)候選答案集合中候選答案與檢索問題之間的句子相似度信息,從所述候選答案集合中選取所述檢索問題的目標答案。
3.如權利要求2所述的自動問答方法,其特征在于,獲取候選答案集合中答案與檢索問題之間的句子相似度信息,包括:
獲取候選答案集合中候選答案對應的答案句子向量、以及檢索問題對應的問題句子向量;
獲取所述答案句子向量與所述問題句子向量之間的向量相似度;
所述根據(jù)候選答案集合中候選答案與檢索問題之間的句子相似度信息,從所述候選答案集合中選取所述檢索問題的目標答案,包括:根據(jù)所述答案句子向量與所述問題句子向量之間的向量相似度,從所述候選答案集合中選取所述檢索問題的目標答案。
4.如權利要求3所述的自動問答方法,其特征在于,獲取候選答案集合中候選答案對應的答案句子向量、以及檢索問題對應的問題句子向量,包括:
獲取候選答案集合內候選答案的答案詞組對應的詞向量,并根據(jù)所述答案詞組對應的詞向量獲取所述候選答案對應的答案句子向量;
獲取檢索問題的問題詞組對應的詞向量,并根據(jù)問題詞組對應的詞向量獲取檢索問題對應的問題句子向量。
5.如權利要求3所述的自動問答方法,其特征在于,獲取候選答案集合中候選答案對應的答案句子向量、以及檢索問題對應的問題句子向量,包括:
將檢索問題表示成相應的問題矩陣,并基于卷積神經網絡模型對問題矩陣進行卷積處理,得到檢索問題對應的問題句子向量;
將候選答案集合內候選答案表示成相應的答案矩陣,并基于所述卷積神經網絡模型對答案矩陣進行卷積處理,得到候選答案對應的答案句子向量。
6.如權利要求5所述的自動問答方法,其特征在于,基于卷積神經網絡模型對問題矩陣進行卷積處理,得到檢索問題對應的問題句子向量,包括:
分別采用多個不同的卷積核對問題矩陣進行卷積運算,得到不同卷積核對應的卷積結果;
根據(jù)不同卷積核對應的卷積結果構建檢索問題對應的問題句子向量;
基于所述卷積神經網絡模型對答案矩陣進行卷積處理,得到候選答案對應的答案句子向量,包括:
分別采用多個不同的卷積核對答案矩陣進行卷積運算,得到不同卷積核對應的卷積結果;
根據(jù)不同卷積核對應的卷積結果構建候選答案對應的答案句子向量。
7.如權利要求1所述的自動問答方法,其特征在于,根據(jù)檢索問題中問題詞組的問題出現(xiàn)次數(shù)、以及候選答案中答案詞的問題答案共現(xiàn)次數(shù),從所述候選答案集合中選取所述檢索問題的目標答案,包括:
獲取候選答案中答案詞的問題答案共現(xiàn)次數(shù)、與檢索問題中問題詞的問題出現(xiàn)次數(shù)的次數(shù)比例;
根據(jù)次數(shù)比例獲取候選答案對應的目標答案概率,所述目標答案概率為所述答案作為檢索問題的目標答案的概率;
根據(jù)答案對應的目標答案概率從所述候選答案集合中選取所述檢索問題的目標答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710872147.3/1.html,轉載請聲明來源鉆瓜專利網。





