[發明專利]RDF數據上基于圖匹配的why-not查詢回答方法有效
| 申請號: | 201710285751.6 | 申請日: | 2017-04-27 |
| 公開(公告)號: | CN107193882B | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 漆桂林;黃超;高桓 | 申請(專利權)人: | 東南大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 南京蘇高專利商標事務所(普通合伙) 32204 | 代理人: | 王安琪 |
| 地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | rdf 數據 基于 匹配 why not 查詢 回答 方法 | ||
本發明公開了一種RDF數據上基于圖匹配的why?not查詢回答方法,包括如下步驟:(1)離線數據結構處理;(2)將why?not問題中的關鍵字映射到RDF數據上的實體;(3)從候選實體出發,構造一個局部圖;(4)查詢分解;(5)圖匹配;(6)生成why?not問題的解釋。本發明的有益效果為:本發明采用的方法可以更好、更高效的確定導致用戶感興趣的項被篩選掉的原因,并且給出相應的比較具體的修改意見,方便用戶更好的去探索用戶期望得到的結果,通常可以讓用戶更加滿意。
技術領域
本發明涉及計算機技術領域,尤其是一種RDF數據上基于圖匹配的why-not查詢回答方法。
背景技術
近年來,大量的RDF數據開始以開放鏈接數據的形式被發布到互聯網上,并且形成了很多開放鏈接知識庫或者垂直領域知識庫,比如Freebase、Yago、DBpedia、ConceptNet等等。這些知識庫逐漸被集成到一些現實生活中的應用場景里面,比如搜索引擎或者查詢回答系統,從而更好的服務于用戶。為了使得用戶可以更直接、方便的去獲取知識,基于知識庫的查詢回答系統開始扮演重要的角色。一些基于RDF數據的查詢回答系統,比如Auqlog、FREyA、NLP-Reduce等,使得用戶不需要了解底層知識庫的詞匯或者模式信息,也可以滿足他們任意復雜的信息需求。
對于基于知識庫的查詢回答系統,其底層的數據通常是從web上進行信息抽取,然后將數據組織成RDF三元組或者其他形式的知識單元存放在知識庫中。然而信息抽取通常不是完全精準的,在信息抽取的過程中,通常會因為信息源的不可靠或者抽取方法的局限性導致一些錯誤信息蔓延到數據庫中,導致數據本身的準確性有所下降。因而當用戶通過查詢回答系統來獲取問題的答案時,系統可能返回給用戶不正確的結果,在用戶好奇心的驅使下,用戶會自然而然的產生為什么用戶想要的答案沒有出現在結果集中這種問題,這種問題被稱作為why-not問題。通常情況下,用戶要解決這種問題,需要不斷的更改自己的查詢條件來對比不同的結果集,并分析用戶期望的數據的相關信息,才能得出為什么用戶期望的結果沒有出現在結果集中的原因。然而在數據量的規模很大的情況下,以及用戶輸入受限時,并不是每次用戶都能如愿分析出原因。此時,由系統根據用戶的反饋來為用戶計算出比較合理的解釋便成為一種提高數據庫可用性的需求。
在解決RDF上的why-not問題方面,Yao等人給出了一種解決方案,該方法通過一種簡單的不斷試錯的方式來找到用戶查詢中導致答案缺失的關系或者概念,并且使用一些啟發式規則進行泛化來修正查詢。該方法對應的系統ANNA由于需要遍歷各種情形進行試錯,計算解釋的效率不高,而且通過泛化得到的結果在大部分情況下并不能給出用戶一種細粒度的解釋。
發明內容
本發明所要解決的技術問題在于,提供一種RDF數據上基于圖匹配的why-not查詢回答方法,為用戶提供一種合理的解釋,指導用戶更好的完善和明確查詢需求,更快的獲取自己期望的結果。
為解決上述技術問題,本發明提供一種RDF數據上基于圖匹配的why-not查詢回答方法,包括如下步驟;
(1)離線數據結構處理;
該步驟對RDF數據進行數據結構上的預處理,包括三個方面:一是使用Jena對RDF數據進行本地持久化存儲,二是使用Lucene對知識庫中所有實體的標簽建立倒排索引,三是訓練一個word2vec模型為知識庫中的每個實體和關系生成一個向量;
(2)將why-not問題中的關鍵字映射到RDF數據上的實體;
對于用戶提出的why-not問題,得到用戶所感興趣的項的關鍵字,然后從步驟(1)所建立的索引庫中檢索該關鍵字對應的實體,從而將關鍵字映射到知識庫上的實體上去,得到一個候選實體集合;
(3)從候選實體出發,構造一個局部圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南大學,未經東南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710285751.6/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





