[發明專利]支持復雜答案的證據搜索在審
| 申請號: | 201880077803.3 | 申請日: | 2018-12-12 |
| 公開(公告)號: | CN111417940A | 公開(公告)日: | 2020-07-14 |
| 發明(設計)人: | J.W.默多克;河銀英;杭仲瑋;K.哈桑;N.馬坎戴亞;C.M.諾蘭;潘林;S.P.佩迪;M.D.斯威夫特 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/2457 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 邸萬奎 |
| 地址: | 美國紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 支持 復雜 答案 證據 搜索 | ||
1.一種生成問題答案的方法,所述方法包括:
通過電子處理器接收具有多個疑問術語的問題;
通過所述電子處理器識別所述問題的多個候選答案,其中所述多個候選答案中的每一個包括多個答案術語;
對于所述多個候選答案中的每一個,搜索多個數據源以確定支持證據段落包括所述多個疑問術語中的一個或多個中的至少一個,以及包括在所述候選答案中的所述多個答案術語中的一個或多個;
通過所述電子處理器,使用評分機制對所述多個候選答案中的每一個的每個所述支持證據段落進行評分,所述評分機制計算所述支持證據段落與所述多個疑問術語的第一相關程度,計算所述支持證據段落與所述多個候選答案中的一個的所述多個答案術語的第二相關程度,并通過結合所述第一相關程度和所述第二相關程度來確定所述支持證據段落的分數;
通過所述電子處理器,基于與對所述多個候選答案中的每一個對每個所述支持證據段落進行所述評分相關聯的所述分數,對所述問題的所述多個候選答案進行排名;以及
基于所述多個候選答案的排名來提供對所述問題的答案。
2.根據權利要求1所述的方法,還包括以下步驟:
使用所述問題和所述候選答案生成關鍵字搜索查詢,其中將所述問題和所述候選答案中的所有所述術語標記為可選。
3.根據權利要求2所述的方法,還包括以下步驟:
使用一個或多個權重來確定所述第一相關度和第二相關度,所述一個或多個權重選自包括術語的詞匯接近度、分布語義和統計模型組成的組。
4.根據權利要求3所述的方法,還包括以下步驟:
為每個所述支持證據段落遍歷一組段落計分器;以及
對每個所述段落計分器確定所述支持證據段落回答所述問題以支持替代答案的程度進行評分,其中所述替代答案與所述候選答案匹配。
5.根據權利要求1所述的方法,還包括以下步驟:
計算所述多個疑問術語的第一匹配分數;
計算所述多個答案術語的第二匹配分數;以及
結合所述第一匹配分數和所述第二匹配分數。
6.根據權利要求2所述的方法,還包括以下步驟:
使用所述關鍵字搜索查詢從數據語料庫搜索所述多個支持證據段落。
7.根據權利要求6所述的方法,還包括以下步驟:
為每個所述支持證據段落遍歷一組段落計分器,以及
對每個所述段落計分器確定所述支持證據段落回答所述問題以支持替代答案的程度進行評分,其中所述替代答案與所述候選答案匹配。
8.根據權利要求7所述的方法,還包括以下步驟:
通過計算每個疑問術語的權重并將所述段落中找到的每個疑問術語的權重之和除以所有疑問術語的權重之和,確定段落的匹配分數。
9.根據權利要求7所述的方法,還包括以下步驟:
對于所述一組段落計分器中的每一個,將所述支持證據段落的所述得分組合成一個最終得分,表明所述段落計分器對所述替代答案的結論。
10.根據權利要求9所述的方法,還包括以下步驟:
通過將所述分數相加和取所述分數的最大值中的至少一項來組合所述支持證據段落的所述分數。
11.如權利要求5所述的方法,還包括以下步驟:
通過將所述第一匹配分數和所述第二匹配分數相乘來組合所述第一匹配分數和所述第二匹配分數。
12.根據權利要求5所述的方法,還包括以下步驟:
通過確定所述第一匹配分數和所述第二匹配分數諧波平均值,將所述第一匹配分數和所述第二匹配分數相結合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201880077803.3/1.html,轉載請聲明來源鉆瓜專利網。





