[發(fā)明專利]RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法有效
| 申請?zhí)枺?/td> | 201710285751.6 | 申請日: | 2017-04-27 |
| 公開(公告)號: | CN107193882B | 公開(公告)日: | 2020-11-20 |
| 發(fā)明(設(shè)計(jì))人: | 漆桂林;黃超;高桓 | 申請(專利權(quán))人: | 東南大學(xué) |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙) 32204 | 代理人: | 王安琪 |
| 地址: | 211189 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | rdf 數(shù)據(jù) 基于 匹配 why not 查詢 回答 方法 | ||
1.一種RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法,其特征在于,包括如下步驟:
(1)離線數(shù)據(jù)結(jié)構(gòu)處理;
該步驟對RDF數(shù)據(jù)進(jìn)行數(shù)據(jù)結(jié)構(gòu)上的預(yù)處理,包括三個方面:一是使用Jena對RDF數(shù)據(jù)進(jìn)行本地持久化存儲,二是使用Lucene對知識庫中所有實(shí)體的標(biāo)簽建立倒排索引,三是訓(xùn)練一個word2vec模型為知識庫中的每個實(shí)體和關(guān)系生成一個向量;
(2)將why-not問題中的關(guān)鍵字映射到RDF數(shù)據(jù)上的實(shí)體;
對于用戶提出的why-not問題,得到用戶所感興趣的項(xiàng)的關(guān)鍵字,然后從步驟(1)所建立的索引庫中檢索該關(guān)鍵字對應(yīng)的實(shí)體,從而將關(guān)鍵字映射到知識庫上的實(shí)體上去,得到一個候選實(shí)體集合;
(3)從候選實(shí)體出發(fā),構(gòu)造一個局部圖;
通過在步驟(1)中所建立的持久化數(shù)據(jù)庫上查詢候選實(shí)體所關(guān)聯(lián)的邊和實(shí)體以及屬性和值信息,并對關(guān)聯(lián)的實(shí)體進(jìn)行擴(kuò)展,得到一個從候選實(shí)體出發(fā),深度為某個固定值的局部圖;
(4)查詢分解;
將用戶查詢分解成若干個具有星型結(jié)構(gòu)的查詢子模式;
(5)圖匹配;
對于從步驟(4)得到的每一個查詢子模式,從局部圖中候選實(shí)體對應(yīng)的頂點(diǎn)出發(fā),生成若干個以候選實(shí)體為頂點(diǎn),邊數(shù)等于查詢子模式的邊數(shù)的星型結(jié)構(gòu)的子實(shí)例圖的集合,然后進(jìn)行查詢子模式和子實(shí)例圖之間的匹配,計(jì)算其相似度;之后將匹配的子實(shí)例圖中的葉子節(jié)點(diǎn)進(jìn)行擴(kuò)展,生成新的星形結(jié)構(gòu)的子實(shí)例圖并加入到子實(shí)例圖集合中,用于后續(xù)查詢子模式的匹配;最終為每一個查詢子模式計(jì)算得到一個匹配的子實(shí)例圖,將這些模式圖進(jìn)行合并生成一個與用戶查詢具有最高全局相似度的實(shí)例圖;
(6)生成why-not問題的解釋;
根據(jù)步驟(5)得到若干從候選實(shí)體出發(fā)且和用戶查詢相似的實(shí)例圖,選取與用戶查詢最相似的實(shí)例圖,并將其中的實(shí)體結(jié)點(diǎn)替換為查詢中對應(yīng)的變量結(jié)點(diǎn);對比該實(shí)例圖和用戶查詢中的每一個結(jié)點(diǎn)和邊的標(biāo)簽信息,即可得到兩個圖的差異之處,這種差異即可用于解釋用戶的why-not問題。
2.如權(quán)利要求1所述的RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法,其特征在于,步驟(4)中RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法將用戶查詢分解成若干個具有星型結(jié)構(gòu)的查詢子模式的具體實(shí)現(xiàn)方法為:找到候選實(shí)體在查詢模式圖中對應(yīng)的變量結(jié)點(diǎn),從該結(jié)點(diǎn)出發(fā),生成一個星型結(jié)構(gòu)的模式子圖;然后將根結(jié)點(diǎn)相連的結(jié)點(diǎn)壓入隊(duì)列,從隊(duì)列中彈出一個結(jié)點(diǎn),若該結(jié)點(diǎn)不是查詢模式圖的葉子結(jié)點(diǎn),則生成一個星型結(jié)構(gòu)的子模式,否則繼續(xù)彈出下一個結(jié)點(diǎn)直到隊(duì)列為空。
3.如權(quán)利要求1所述的RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法,其特征在于,步驟(5)中RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法采用一種綜合考慮語義信息和結(jié)構(gòu)信息的相似度計(jì)算方法,計(jì)算方法如下:
在考慮語義信息方面,對于兩個結(jié)點(diǎn)或者兩條邊之間的相似,若結(jié)點(diǎn)是知識庫中的一對實(shí)例或者邊是知識庫中的一對關(guān)系,則通過計(jì)算其對應(yīng)的向量之間的余弦距離來表征語義相似度,否則采用編輯距離計(jì)算相似度;
在考慮結(jié)構(gòu)信息方面,如果節(jié)點(diǎn)是一個類結(jié)點(diǎn),或者邊的標(biāo)簽是type信息,則采用最小公共父結(jié)點(diǎn)LCA方法來計(jì)算其結(jié)構(gòu)上的相似度,否則,采用Jaccard距離計(jì)算公式計(jì)算圖之間的結(jié)構(gòu)相似度。
4.如權(quán)利要求1所述的RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法,其特征在于,步驟(6)中RDF數(shù)據(jù)上基于圖匹配的why-not查詢回答方法在選取與用戶查詢最相似的實(shí)例圖的時候,通過為每一個候選實(shí)體生成若干和用戶查詢匹配的實(shí)例圖,并選取和用戶查詢具有最高全局相似度的實(shí)例圖完成。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于東南大學(xué),未經(jīng)東南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710285751.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種保護(hù)敏感資源描述框架數(shù)據(jù)的方法、裝置及系統(tǒng)
- 一種存儲資源描述框架數(shù)據(jù)的方法和裝置
- 一種基于實(shí)體圖社團(tuán)結(jié)構(gòu)的RDF關(guān)鍵詞查詢方法
- 面向大規(guī)模RDF數(shù)據(jù)的高效語義索引的構(gòu)建方法
- 一種基于本體的動態(tài)語義檢索方法
- 面向大規(guī)模RDF數(shù)據(jù)的可達(dá)性查詢索引的構(gòu)建方法
- 基于RDF圖的分布式關(guān)鍵詞查詢方法
- 一種基于節(jié)點(diǎn)上下文向量空間的RDF近似答案查詢方法
- 一種基于多層劃分框架的RDF分布式存儲方法
- 一種混合垃圾中RDF提取的工藝與設(shè)備
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





