[發明專利]推理問答方法、裝置以及設備有效
| 申請號: | 202010314131.2 | 申請日: | 2020-04-20 |
| 公開(公告)號: | CN111597314B | 公開(公告)日: | 2023-01-17 |
| 發明(設計)人: | 邵楠;崔一鳴;王士進;胡國平;劉挺 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/335;G06F16/338 |
| 代理公司: | 北京維澳專利代理有限公司 11252 | 代理人: | 常小溪;王立民 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 推理 問答 方法 裝置 以及 設備 | ||
本發明公開了一種推理問答方法、裝置以及設備。具體是提出源于實體共現思路的啟發式文檔檢索算法,其能夠有效檢索出復雜問題所隱含的相關線索文檔,同時可以平衡算法效率與準確性;此外,提出了將檢索出的目標文檔進行拓撲化,作為后續解答、抽取答案的基礎;最后再綜合用戶輸入、線索文檔、拓撲結構等信息,模擬出人類在推理復雜問題時的推導過程,這樣便可針對復雜問題進行精準解答,這其中涉及的檢索環節、構建圖結構環節以及推理解答環節,相互依賴且步步相關,通過對每一個環節的設計及改進,共同完成了本發明提出的推理問答機制。
技術領域
本發明涉及自動問答技術領域,尤其涉及一種推理問答方法、裝置以及設備。
背景技術
在人們的日常生活中,需要通過互聯網獲取某些問題答案的場景非常普遍,這些需要獲取的信息往往通過使用問題相關關鍵字在搜索引擎中進行檢索后人工瀏覽得到。然而,隨著信息爆炸的時代到來,網絡中充斥著越來越多的垃圾和重復信息,導致使用傳統搜索引擎尋找問題答案的過程變得繁瑣和低效。因此,人們往往希望擁有能直接通過輸入問題即可返回最終答案的自動問答機制。
隨著近些年來人工智能特別是計算語言學的飛速發展,推動了傳統的問答機制準確率的迅速提升并開始走向實用領域。當人們想要獲取某個問題的答案時,只需要輸入問題即可迅速得獲得答案。目前,谷歌、百度等主要的搜索引擎都已將問答服務作為整個搜索引擎中的子系統投入使用,當用戶搜索問題為簡單問題時,將由問答系統直接返回答案給用戶。
然而,現有的問答系統往往通過遍歷文檔庫中的每一個文檔,并匹配與問題具有相似語義的文本片段作為答案。這種問答方式不具備任何推理能力,因此無法回答較為復雜的問題,同時在檢索過程中以及檢索后也無法挖掘并結合多個文檔的信息,這些缺陷制約了目前問答機制的實用效果。
發明內容
鑒于上述,本發明旨在提供一種推理問答方法、裝置以及設備,并相應地提出一種計算機可讀存儲介質以及計算機程序產品,通過這些方面能夠模擬人類的推理行為,從而回答那些需要一定推理能力才能得出答案的復雜問題。
本發明采用的技術方案如下:
第一方面,本發明提供了一種推理問答方法,包括:
根據輸入問題在知識庫中啟發式檢索出包含解答相關線索的目標文檔;
基于所述目標文檔構建相應的圖結構;
結合所述輸入問題、所述目標文檔、所述圖結構以及預設的推理解答策略,預測并輸出答案。
在其中一種可能的實現方式中,所述根據輸入問題在知識庫中啟發式檢索出包含解答相關線索的目標文檔包括:
利用多輪相關性計算以及實體提取策略,從知識庫中篩選出包含解答相關線索的若干候選文檔;
結合所述輸入問題,對所述候選文檔進行相關性重估;
根據重估結果進行重排序,并選取若干高分候選文檔作為所述目標文檔。
在其中一種可能的實現方式中,所述利用多輪相關性計算以及實體提取策略,從知識庫中篩選出包含解答相關線索的若干候選文檔包括:
計算知識庫中各第一文檔相對于所述輸入問題的相關性得分;
根據相關性得分,排序后選取若干高分第一文檔構建候選文檔集合;
從所述候選文檔集合內的第一文檔中提取若干實體;
在知識庫中檢索出與所述實體相關的第二文檔;
計算各所述第二文檔相對于所述輸入問題的相關性得分;
根據相關性得分,排序后選取若干高分第二文檔補入所述候選文檔集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010314131.2/2.html,轉載請聲明來源鉆瓜專利網。





