[發明專利]一種面向開放域問答的基于機器閱讀理解的答案獲取方法及系統有效
| 申請號: | 202010111750.1 | 申請日: | 2020-02-24 |
| 公開(公告)號: | CN111324717B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 彭敏;李冬;郭天翼;武涵;胡星燦;張鼎 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F40/30;G06N3/0455;G06N3/044;G06N3/08 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 羅飛 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 開放 問答 基于 機器 閱讀 理解 答案 獲取 方法 系統 | ||
本發明公開了一種面向開放域問答的基于機器閱讀理解的答案獲取方法,采用基于BERT的語義編碼模塊和信息交互注意力網絡,深入地捕獲問題和文檔的潛在語義表示,有效地提取并融合問題和文檔間的信息,捕獲問題與文檔的全局特征;采用基于Pointer?Networks的答案獲取模塊,將注意力權重作為指針,更加準確地定位所預測答案的起止位置。本發明提出的一種面向開放域問答的基于閱讀理解的答案獲取方法,在CMRC?2018數據集上進行實證評估。實驗結果表明,該發明能夠達到開放域問答任務標準水平,并取得了優異的表現。
技術領域
本發明涉及自然語言處理技術領域,具體涉及一種面向開放域問答的基于機器閱讀理解的答案獲取方法及系統。
背景技術
隨著人工智能技術的發展,人機交互也變得越來越重要。其中,人機交互的智能問答是目前技術開發的重點。
在自然語言處理領域,問答系統即是給定一個語料庫和一個問題,算法系統將從語料庫中進行檢索,并用準確、簡潔的自然語言組織答案返回給用戶。隨著檢索技術與知識庫技術的不斷發展,面向大量文檔知識庫的開放域問答發展起來。國外早期開發的具有代表性的開放域問答系統有麻省理工大學的Start、密歇根大學的AnswerBus、華盛頓大學的MULDER系統等。中文問答系統的研究開始較晚,具有代表性的有中國科學院計算所開發的NKI系統,它能夠使用戶通過自然語言進行提問,如天氣預報、人物、中醫疾病、地理等方面的問題,并可以獲得較為滿意的答案。然而,人們隨之發現建造一個新知識庫是十分耗時耗力的,并且知識庫單一的結構也使很多問題得不到令人滿意的答案。以往的問答系統的主要研究對象是事實類、列舉類等簡單問句,面向開放域問答復雜類問句的語義理解研究還不深入,甚至忽略了復雜類問題中蘊含的事件語義信息。這對問答系統中的問題理解技術提出了很高的要求。
閱讀理解是建立在閱讀基礎上的理解,可以被抽象地概括為通過閱讀從文本中抽取信息并理解意義的過程。機器閱讀理解,即是向神經網絡模型給出一段材料和問題,讓機器閱讀大量的材料后對相關的問題做出回答,其涉及到語言理解、知識推理和摘要生成等技術。
本申請發明人在實施本發明的過程中,發現現有技術的方法,至少存在如下技術問題:
智能問答是人工智能技術發展的一個重點任務,尤其在開放域問答任務上,智能問答仍面臨著諸多挑戰?,F有的問答系統的主要研究對象是事實類、列舉類等簡單問句,對面向開放域問答復雜類問句的語義理解研究還不深入,甚至忽略了復雜類問題中蘊含的事件語義信息。并且,現有方法在信息提取和融合方法存在不足,使得答案獲取的效果不佳。
發明內容
有鑒于此,本發明提供了一種面向開放域問答的基于機器閱讀理解的答案獲取方法及系統,用以解決或者至少部分解決現有方法由于在信息提取和融合方法存在不足,使得答案獲取的效果不佳的技術問題。
為了解決上述技術問題,本發明第一方面提供了一種面向開放域問答的基于機器閱讀理解的答案獲取方法,包括:
S1:獲取閱讀理解數據集,劃分出訓練集、驗證集和測試集,對獲取的閱讀理解數據集進行預處理;
S2:構建閱讀理解的答案獲取模型,閱讀理解的答案獲取模型包括文檔和問題的語義編碼模塊、信息交互編碼模塊以及答案獲取模塊,其中,文檔和問題的語義編碼模塊用于從輸入的數據集中捕獲和編碼得到文檔的上下文語義表示和問題的上下文語義表示,信息交互編碼模塊用于根據文檔的上下文語義表示和問題的上下文語義表示,捕獲和編碼得到與問題相關的文檔編碼表示,答案獲取模塊用于根據與問題相關的文檔編碼表示,獲取答案;
S3:根據劃分出的訓練集和設置的損失函數,對閱讀理解的答案獲取模型包含的文檔和問題的語義編碼模塊、信息交互編碼模塊以及答案獲取模塊進行聯合訓練,獲得訓練好的閱讀理解的答案獲取模型;
S4:利用訓練好的閱讀理解的答案獲取模型對待處理的數據進行預測,得到對應的答案。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010111750.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙介質比例流量解耦式二維調節閥
- 下一篇:一種交互式盲人智能輔助裝置及方法





