[發明專利]一種基于知識圖譜的問答方法有效
| 申請號: | 201710858596.2 | 申請日: | 2017-09-21 |
| 公開(公告)號: | CN107748757B | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 胡春明;許程;賀薇;張日崇 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/33;G06F40/295;G06F40/242 |
| 代理公司: | 北京中創陽光知識產權代理有限責任公司 11003 | 代理人: | 尹振啟 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 問答 方法 | ||
本發明提供一種基于知識圖譜的問答方法。本發明提供的一種基于知識圖譜的問答方法由主體實體匹配,關系匹配以及答案確定來實現。主題實體匹配主要包括命名實體識別和實體鏈接兩個部分。命名實體識別旨在識別自然語言問句q中人名、地名、組織機構名等命名實體。實體鏈接將識別出的命名實體對應到知識庫中的某一個實體上,即找到三元組中的實體s,關系匹配是通過自然語言理解技術理解問句q所表達的語義,并且與搜索空間中三元組(s,p,o)中的關系p進行匹配,以此確定問句所表達的語義及其與知識庫中對應的關系。通過實體識別和實體鏈接得到候選主題實體,關系匹配能夠得到候選關系,由此得到若干候選三元組,答案確定需要根據實體識別得分,關系匹配得分等特征對這些候選三元組進行排序,確定最后答案。
技術領域
本發明涉及一種檢索方法,尤其涉及一種基于知識圖譜的問答方法。
背景技術
問答系統(Question Answering System,QA)是信息檢索系統的一種高級形式。它能用準確、簡潔的自然語言回答用戶用自然語言提出的問題。其研究興起的主要原因是人們對快速、準確地獲取信息的需求。問答系統是目前人工智能和自然語言處理領域中一個倍受關注并具有廣泛發展前景的研究方向。
上世紀五六十年代計算機誕生的初期,人們對問答系統就有所研究與嘗試。其中有代表性的包括Baseball和Lunar,但早期的系統多是針對特定領域設計,數據規模比較小,語義理解能力較弱??傮w來說,系統功能有限,很難被廣泛引用。
隨著大規模網絡數據資源的出現,尤其是知識圖譜的出現,使得基于知識圖譜的問答系統更加智能化,知識庫是一種儲存復雜結構化信息的新型技術。知識庫中存儲了大量事實型知識,其內部使用知識圖譜(knowledge graph)模型對實體及實體間的關系間的關系信息進行建模。如今,知識庫多以RDF(Resource Description Framework)的格式存儲數據,一條事實(fact)被表示為一個(S,P,O)三元組,形如(subject,predicate,object),其中主體(subject)和客體(object)為命名實體,客體(object)有時會是屬性值,述語(predicate)是主體(subject)和客體(object)間的關系。目前基于知識圖譜的問答方法在國內外的研究中大致可以被分為兩類,基于語義解析的知識庫問答方法、基于信息抽取的知識庫問答方法。
基于語義解析的知識庫問答方法的核心在于自然語言問句的形式化表示,即將自然語言問句轉化為某種基于符號的邏輯表達式,比如lambda-DCS(基于依賴關系的語義標注),再轉化為知識庫查詢語言比如SPARQL查詢知識庫得到答案。此種方法通常會利用監督學習的方法訓練出一個語義解析器,來生成自然語言問句的候選邏輯表達式,之后利用基于模板的方式抽取大量文本中表示關系的表達,提出匹配算法來構建知識庫中的表達與自然語言表達的匹配,邏輯表達式轉換為知識庫中的表達后即可在知識庫中查找到對應的答案。
基于信息抽取的知識庫問答方法不使用邏輯表達式來表示問句,減少人工特征干預,直接將知識庫中的事實與自然語言問句都轉化為某種表達形式(比如向量),然后通過計算相似度來尋找最可能回答問句的答案。這種方法一般會利用詞嵌入將單詞轉換為向量形式,再使用神經網絡對自然語言問句進行編碼,意在學習到問句不同維度的信息,編碼后再同答案及答案子圖的向量表示計算相似度,選擇相似度高的匹配。
兩者對比,基于語義解析的問答方法人工干預更多,對自然語言問句要求的形式更為嚴格,但是優勢是對訓練語料的依賴性不強。隨著深度學習在自然語言處理領域的發展,基于信息抽取的問答方法是現在普遍的探索方式,這種方法的優勢在于不局限于問題的嚴格表達,能夠通過深度學習理解問句表達的語義從而找到正確的答案,但會依賴于訓練數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710858596.2/2.html,轉載請聲明來源鉆瓜專利網。





