[發明專利]一種基于文本摘要的非事實類問答答案選擇方法及系統有效
| 申請號: | 201810428163.8 | 申請日: | 2018-05-07 |
| 公開(公告)號: | CN108681574B | 公開(公告)日: | 2021-11-05 |
| 發明(設計)人: | 馬榮強;張健;李淼;陳雷;高會議 | 申請(專利權)人: | 中國科學院合肥物質科學研究院 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/332;G06F16/34;G06F40/289;G06F40/30;G06F40/211 |
| 代理公司: | 合肥天明專利事務所(普通合伙) 34115 | 代理人: | 奚華保 |
| 地址: | 230031 安徽*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文本 摘要 事實 問答 答案 選擇 方法 系統 | ||
1.一種基于文本摘要的非事實類問答答案選擇方法,其特征在于,包括:
抽取待選擇答案文本的首句和尾句;
利用文本摘要模型TextRank對所述待選擇答案文本除首句和尾句之外剩余的文本進行摘要抽取,得到初步文本摘要,包括:
將所述待選擇答案文本分割成句子,并對每個句子進行分詞;
對每個詞的詞性進行標注,并對標注后詞的信息進行過濾,得到特定詞的詞項;
將所述特定詞的詞項或句子作為文本單元,將文本單元構成節點,文本單元間的相似度構成節點之間的邊,得到權重圖模型;
計算任兩個節點的相似度,并將相似度值作為節點權重計算公式的計算參數;
對所述節點權重計算公式進行迭代直至收斂,得到各節點的得分結果;
根據收斂時各節點之間的得分,對各節點進行排序,得到排序后的各節點;
按照設定的抽取比率,在排序后的各節點中抽取文本單元組成初步文本摘要;
將所述首句、所述初步文本摘要以及所述尾句依次組合,得到待選擇的答案文本摘要;
將問句和所述待選擇的答案文本摘要作為神經網絡語義表示模型的輸入,得到問句和所述待選擇的答案文本摘要的語義相關程度;
將與問句語義相關程度最高的答案文本摘要作為答案返回。
2.如權利要求1所述的基于文本摘要的非事實類問答答案選擇方法,其特征在于,所述抽取所述待選擇答案文本的首句和尾句,包括:
根據所述待選擇答案文本中首句和尾句的位置,將所述待選擇答案文本的首句和尾句抽取出來。
3.如權利要求1所述的基于文本摘要的非事實類問答答案選擇方法,其特征在于,所述任兩個節點的相似度的計算方法包括:詞匯重疊法、字符串法、余弦相似度法以及最大共同子序列法。
4.一種基于文本摘要的非事實類問答答案選擇系統,其特征在于,包括依次連接的第一抽取模塊、第二抽取模塊、組合模塊、匹配模塊以及確定模塊;
第一抽取模塊,用于抽取待選擇答案文本的首句和尾句;
第二抽取模塊,用于利用文本摘要模型TextRank對所述待選擇答案文本除首句和尾句之外剩余的文本進行摘要抽取,得到初步文本摘要,所述第二抽取模塊包括依次連接的分割單元、過濾單元、權重圖模型構建單元、相似度計算單元、迭代單元、排序單元以及組成單元;
分割單元,用于將所述待選擇答案文本分割成句子,并對每個句子進行分詞;
過濾單元,用于對每個詞的詞性進行標注,并對標注后詞的信息進行過濾,得到特定詞的詞項;
權重圖模型構建單元,用于將所述特定詞的詞項或句子作為文本單元,將文本單元構成節點,文本單元間的相似度構成節點之間的邊,得到權重圖模型;
相似度計算單元,用于計算任兩個節點的相似度,并將相似度值作為節點權重計算公式的計算參數;
迭代單元,用于對所述節點權重計算公式進行迭代直至收斂,得到各節點的得分結果;
排序單元,用于根據收斂時各節點之間的得分,對各節點進行排序,得到排序后的各節點;
組合單元,用于按照設定的抽取比率,在排序后的各節點中抽取文本單元組成初步文本摘要;
組合模塊,用于將所述首句、所述初步文本摘要以及所述尾句依次組合,得到待選擇的答案文本摘要;
匹配模塊,用于將問句和所述待選擇的答案文本摘要作為神經網絡語義表示模型的輸入,得到問句和所述待選擇的答案文本摘要的語義相關程度;
確定模塊,用于將與問句語義相關程度最高的答案文本摘要作為答案返回。
5.如權利要求4所述的基于文本摘要的非事實類問答答案選擇系統,其特征在于,所述第一抽取模塊具體用于:
根據所述待選擇答案文本中首句和尾句的位置,將所述待選擇答案文本的首句和尾句抽取出來。
6.如權利要求4所述的基于文本摘要的非事實類問答答案選擇系統,其特征在于,所述相似度計算單元采用的相似度計算方法包括:詞匯重疊法、字符串法、余弦相似度法以及最大共同子序列法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院合肥物質科學研究院,未經中國科學院合肥物質科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810428163.8/1.html,轉載請聲明來源鉆瓜專利網。





