[發(fā)明專利]基于Pregel的分布式起源保障正則路徑查詢算法在審
| 申請(qǐng)?zhí)枺?/td> | 201810177109.0 | 申請(qǐng)日: | 2018-03-04 |
| 公開(公告)號(hào): | CN108519994A | 公開(公告)日: | 2018-09-11 |
| 發(fā)明(設(shè)計(jì))人: | 王鑫;辛月祺 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 劉玥 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 路徑查詢 正則表達(dá)式 算法 結(jié)果路徑 起源 圖數(shù)據(jù) 自動(dòng)機(jī) 消息傳遞模型 擴(kuò)展性 查詢結(jié)果 消息傳遞 優(yōu)化策略 中間結(jié)果 構(gòu)建 等價(jià) 匹配 查詢 引入 統(tǒng)計(jì) | ||
1.一種基于Pregel的分布式起源保障正則路徑查詢算法,其特征在于,包括以下步驟:
1)對(duì)于給定的正則路徑查詢Q=(x,r,y),根據(jù)正則表達(dá)式r計(jì)算first,last,follow集;
2)進(jìn)一步構(gòu)建正則表達(dá)式r所等價(jià)的Glushkov自動(dòng)機(jī)A=(St,Σ,δ,q0,F);
3)使用Pregel消息傳遞模型在RDF圖數(shù)據(jù)中匹配正則路徑查詢,通過消息傳遞的方式、以頂點(diǎn)為中心的計(jì)算之后得到結(jié)果路徑;
4)統(tǒng)計(jì)所有滿足正則表達(dá)式r的結(jié)果路徑即為查詢結(jié)果。
2.根據(jù)權(quán)利要求1所述的一種基于Pregel的分布式起源保障正則路徑查詢算法,步驟1)中,所述的正則表達(dá)式被遞歸定義為r::=ε|p|r/r|r|r|r*,其中ε為空串,p為字母表Σ中的任意字符,/代表連接、|代表連接、*代表閉包。
3.根據(jù)權(quán)利要求1所述的一種基于Pregel的分布式起源保障正則路徑查詢算法,步驟2)中,基于正則表達(dá)式構(gòu)建Glushkov自動(dòng)機(jī)時(shí),用Por(r)={1,...,|r|}表示r中字符位置的集合,其中|r|表示r的長(zhǎng)度,i∈Pos(r)是r[i]的索引。
4.根據(jù)權(quán)利要求1所述的一種基于Pregel的分布式起源保障正則路徑查詢算法,步驟1)中,所述的first集為正則表達(dá)式r所表示的語言L(r)中的任一字符串開頭字符所對(duì)應(yīng)的狀態(tài)集合,所述的last集為L(zhǎng)(r)中的任一字符串結(jié)尾字符所對(duì)應(yīng)的狀態(tài)集合,所述的follow集為L(zhǎng)(r)中的任一字符串中某個(gè)位置字符的接下來字符所對(duì)應(yīng)狀態(tài)集。
5.根據(jù)權(quán)利要求1所述的一種基于Pregel的分布式起源保障正則路徑查詢算法,步驟3)中,所述的計(jì)算的過程并行在每個(gè)頂點(diǎn)進(jìn)行,在滿足自動(dòng)機(jī)轉(zhuǎn)換函數(shù)的條件下向前擴(kuò)展一個(gè)狀態(tài)q∈St來匹配v∈V,直至匹配到結(jié)束狀態(tài)或不再有頂點(diǎn)v能夠與自動(dòng)機(jī)中的狀態(tài)q相匹配,具體包括以下步驟:
3.1)給出判斷條件:對(duì)于RDF圖數(shù)據(jù)T=(V,E,l)中的每個(gè)頂點(diǎn)v∈V,如果每個(gè)頂點(diǎn)v的出邊屬性標(biāo)簽與first集中狀態(tài)對(duì)應(yīng)的字符一致,則該頂點(diǎn)v與first集中狀態(tài)可以相匹配;
3.2)根據(jù)步驟3.1)的判斷條件,計(jì)算與每個(gè)頂點(diǎn)v可能匹配的狀態(tài)q,形成匹配f=(v,q),完成第一步匹配;
3.3)形成的匹配作為消息m發(fā)送給其他鄰居頂點(diǎn),其他鄰居頂點(diǎn)接收消息集M;
3.4)根據(jù)接收到消息集M中已有的匹配f,計(jì)算當(dāng)前匹配的下一個(gè)可能的狀態(tài)q',即通過follow集繼續(xù)擴(kuò)展,通過頂點(diǎn)v的出邊屬性與follow集中狀態(tài)對(duì)應(yīng)的字符是否一致,判斷該頂點(diǎn)v與follow集中狀態(tài)是否可以匹配,如果可以匹配,向前拓展一個(gè)狀態(tài)以此來滿足正則表達(dá)式r;
3.5)重復(fù)步驟3.3)、3.4)直至當(dāng)前頂點(diǎn)匹配到的狀態(tài)屬于last集,當(dāng)前路徑為結(jié)果集中的路徑;
3.6)對(duì)于已經(jīng)完成的路徑重復(fù)步驟3.5),直至不再有新的結(jié)果路徑產(chǎn)生。
6.根據(jù)權(quán)利要求1所述的一種基于Pregel的分布式起源保障正則路徑查詢算法,步驟4)中,對(duì)于步驟3)中獲得的每條結(jié)果路徑在該路徑中匹配結(jié)束狀態(tài)的頂點(diǎn)中保存,遍歷RDF數(shù)據(jù)圖的每個(gè)頂點(diǎn)v∈V,即可獲取該查詢的全部結(jié)果路徑。
7.根據(jù)權(quán)利要求1所述的一種基于Pregel的分布式起源保障正則路徑查詢算法,步驟4)中,由于從匹配起始狀態(tài)的頂點(diǎn)及其匹配對(duì)(v0,q0),到匹配結(jié)束狀態(tài)的頂點(diǎn)及其匹配對(duì)(vn,qn),存在一條從v0到vn路徑(v0,v1,...,vn),且qi+1=δ(qi,(vi,vi+1)),因此,滿足正則表達(dá)式r的結(jié)果路徑即為查詢結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810177109.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 路徑預(yù)約規(guī)劃結(jié)果供其他系統(tǒng)使用的系統(tǒng)及方法
- 路徑預(yù)約規(guī)劃結(jié)果查詢、取消、修改、下載系統(tǒng)及方法
- 查詢規(guī)劃方法及裝置
- 一種大規(guī)模知識(shí)圖譜復(fù)雜路徑查詢的視圖物化方法
- 一種大規(guī)模知識(shí)圖譜路徑查詢預(yù)測(cè)器構(gòu)造方法
- 查詢方法、裝置、電子設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 圖數(shù)據(jù)的路徑檢索處理方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 圖譜路徑查詢方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 對(duì)象代理數(shù)據(jù)庫中多路徑跨類查詢及優(yōu)化方法
- 一種基于近似算法的最短路徑查詢方法和系統(tǒng)
- 路徑規(guī)劃結(jié)果調(diào)整方法及系統(tǒng)
- 路徑預(yù)約規(guī)劃結(jié)果同步系統(tǒng)及方法
- 路徑預(yù)約規(guī)劃結(jié)果供其他系統(tǒng)使用的系統(tǒng)及方法
- 路徑預(yù)約規(guī)劃結(jié)果動(dòng)態(tài)更新系統(tǒng)及方法
- 路徑預(yù)約規(guī)劃結(jié)果查詢、取消、修改、下載系統(tǒng)及方法
- 修正路徑規(guī)劃結(jié)果的方法
- 路徑規(guī)劃結(jié)果修正方法及路徑規(guī)劃裝置
- 一種自適應(yīng)的定址尋路規(guī)劃方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 定址尋路規(guī)劃方法、裝置、設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 用于自動(dòng)駕駛車輛的信息處理方法和裝置





