[發明專利]基于深度學習的答案抽取方法及系統有效
| 申請號: | 201710948835.3 | 申請日: | 2017-10-12 |
| 公開(公告)號: | CN107729468B | 公開(公告)日: | 2019-12-17 |
| 發明(設計)人: | 路松峰;萬飛;黃炎;徐科;王同洋 | 申請(專利權)人: | 華中科技大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F16/953;G06F17/27 |
| 代理公司: | 42201 華中科技大學專利中心 | 代理人: | 廖盈春;李智 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 學習 答案 抽取 方法 系統 | ||
本發明公開了一種基于深度學習的答案抽取方法及系統,其中,方法的實現包括:根據待回答問題中的關鍵詞搜集與待回答問題的答案相關的知識碎片;基于待回答問題的類型,對知識碎片進行詞性標注分析,將包含符合待回答問題的類型的知識碎片作為候選答案;利用已訓練的word2vec模型,計算關鍵詞與候選答案中的知識碎片所包含的詞語的相似度,找出滿足相似度要求的詞語作為目標候選答案;將目標候選答案中的詞語反代入到待回答問題中得到若干個目標語句,并通過判斷各目標語句的語義信息,對各目標語句進行排序,將排序最靠前的目標語句作為目標答案。通過本發明能夠找到相似度較高的多個詞語的答案,從而提高了系統的精確度。
技術領域
本發明屬于人工智能與深度學習技術領域,更具體地,涉及一種基于深度學習的答案抽取方法及系統。
背景技術
問答機器人是指以自然語言理解技術為核心,使得計算機能夠理解用戶提出的問題,實現人與計算機之間的有效溝通,并且提供強大的搜索能力,準確回答用戶的問題。其中,目前在計算機客服系統中普遍采用的智能問答系統就是一種自動問答系統,它是一種通過自然語言技術,能夠理解用戶的問題,并且提供準確答案的人工智能系統。
現有問答系統大多都是先以句子為單位進行分詞及標注詞性。利用問句類型表得到預期答案類型,利用句型分析得到答案的可能形式。最后將片段中不含預期答案類型的句子排除得到答案候選集。這類方法存在的問題是抽取方法只能識別特定詞語的答案而不能識別相似詞語的答案,從而導致識別準確性較低。
發明內容
針對現有技術的以上缺陷或改進需求,本發明提供了一種基于深度學習的答案抽取方法及系統,由此解決現有答案抽取方法中存在的只能識別特定詞語的答案而不能識別相似詞語的答案,而導致的識別準確性較低的技術問題。
為實現上述目的,按照本發明的一個方面,提供了一種基于深度學習的答案抽取方法,包括:
根據待回答問題中的關鍵詞搜集與所述待回答問題的答案相關的知識碎片;
基于所述待回答問題的類型,對所述知識碎片進行詞性標注分析,將包含符合所述待回答問題的類型的知識碎片作為候選答案;
利用已訓練的word2vec模型,計算所述關鍵詞與所述候選答案中的知識碎片所包含的詞語的相似度,找出滿足相似度要求的詞語作為目標候選答案;
將所述目標候選答案中的詞語反代入到所述待回答問題中得到若干個目標語句,對各目標語句進行語義依存分析,并通過判斷各目標語句的語義信息,對各目標語句進行排序,將排序最靠前的目標語句作為目標答案。
優選地,所述方法還包括:
根據所述關鍵詞的重要程度對所述知識碎片進行打分,其中,所述關鍵詞的重要程度越高,則所述知識碎片的分數越高,且所述關鍵詞位于所述知識碎片所屬標題中的重要程度高于位于所述知識碎片中的重要程度;
判斷所述知識碎片的分數是否高于分數閾值,若高于所述分數閾值,則將所述知識碎片作為候選答案,并執行所述利用已訓練的word2vec模型,計算所述關鍵詞與所述候選答案中的知識碎片所包含的詞語的相似度,找出滿足相似度要求的詞語作為目標候選答案;
若所述知識碎片的分數不高于所述分數閾值,則執行所述基于所述待回答問題的類型,對所述知識碎片進行詞性標注分析,將包含符合所述待回答問題的類型的知識碎片作為候選答案。
優選地,所述方法還包括:
采用結巴分詞,將訓練語料進行分詞;
將分好詞的訓練語料進行訓練得到word2vec模型,其中,輸入為由所有分詞組成的輸入文件,輸出為詞向量,每個單詞的向量維度是M,訓練的窗口大小為N,采樣閾值為L。
按照本發明的另一方面,提供了一種基于深度學習的答案抽取系統,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中科技大學,未經華中科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710948835.3/2.html,轉載請聲明來源鉆瓜專利網。





