[發(fā)明專利]基于本體的大規(guī)模發(fā)布訂閱流水線匹配方法無效
| 申請?zhí)枺?/td> | 200910097139.1 | 申請日: | 2009-03-23 |
| 公開(公告)號: | CN101510213A | 公開(公告)日: | 2009-08-19 |
| 發(fā)明(設(shè)計)人: | 胡昔祥 | 申請(專利權(quán))人: | 杭州電子科技大學(xué) |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 | 代理人: | 杜 軍 |
| 地址: | 310018浙江省*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 本體 大規(guī)模 發(fā)布 訂閱 流水線 匹配 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于計算機(jī)技術(shù)領(lǐng)域,涉及一種基于本體的大規(guī)模發(fā)布訂閱流水線匹配方法。該方法將本體技術(shù)和并行計算技術(shù)引入發(fā)布訂閱中間件系統(tǒng),以提高大規(guī)模發(fā)布訂閱中間件系統(tǒng)的匹配準(zhǔn)確性和時間效率。
背景技術(shù)
發(fā)布訂閱中間件系統(tǒng)非常適合因特網(wǎng)大規(guī)模信息分發(fā)、移動計算、網(wǎng)格計算等分布式異構(gòu)平臺松散通信的需求,有著廣泛的應(yīng)用前景。傳統(tǒng)的發(fā)布訂閱中間件系統(tǒng)有基于主題、基于內(nèi)容、基于XML等形式,他們大多數(shù)依賴于特定的事件類型和簡單的匹配機(jī)制,如:關(guān)鍵字匹配、屬性值的謂詞比較、XPath樹模式匹配等。而基于本體的發(fā)布訂閱中間件系統(tǒng)可以結(jié)合事件/訂閱本體模型,提供事件/訂閱的語義匹配,從而極大地提高匹配的準(zhǔn)確性,同時也使用戶能更方便地表達(dá)其訂閱興趣。在基于本體的發(fā)布訂閱中間件系統(tǒng)中,RDF是表達(dá)語義的基礎(chǔ)。為了表達(dá)事件/訂閱的語義信息,通常采用RDF圖來表示事件,稱為RDF事件圖。用建立在RDF圖上的圖模式來表達(dá)用戶訂閱條件,稱為RDF訂閱圖模式。因而,基于本體的發(fā)布訂閱中間件系統(tǒng)的匹配方法實質(zhì)上就是一種RDF圖模式匹配方法。尤其是,在大規(guī)模發(fā)布訂閱中間件系統(tǒng)中,存在著大量帶有謂詞約束的RDF訂閱圖模式。如何高效、快速地進(jìn)行RDF訂閱圖模式的匹配成為基于本體的大規(guī)模發(fā)布訂閱中間件系統(tǒng)面臨的主要挑戰(zhàn)。
目前,已有一些RDF圖模式匹配方法,如:汪錦嶺等人提出基于擴(kuò)展元語句(extended?meta-statement)數(shù)組和匹配狀態(tài)樹的方法。該方法為每個RDF訂閱圖模式維護(hù)一棵獨(dú)立的匹配狀態(tài)樹,匹配過程需要重復(fù)遍歷匹配狀態(tài)樹的所有狀態(tài)結(jié)點(diǎn),并計算和生成新的狀態(tài)結(jié)點(diǎn)。最后根據(jù)每棵匹配狀態(tài)樹的最終狀態(tài),來判斷哪些RDF訂閱圖模式被匹配成功。該匹配方法的缺點(diǎn)是匹配時間會隨著系統(tǒng)訂閱數(shù)量增加而急劇增長。另外,Milenko等人提出一種基于全局RDF圖模式的匹配方法,該方法將系統(tǒng)中所有RDF訂閱圖模式合并成一個全局的RDF訂閱圖模式。顯然該方法只適合訂閱數(shù)量較少或訂閱中變量個數(shù)有限的情況,因為當(dāng)每個RDF訂閱圖模式包含有較多變量時,由于變量標(biāo)識和約束條件的多樣性和差異性,合并這些RDF訂閱圖模式是非常困難和費(fèi)時的。綜合來看,已有的匹配方法遠(yuǎn)遠(yuǎn)無法滿足大規(guī)模發(fā)布訂閱中間件系統(tǒng)的性能要求。因此,需要發(fā)展一種更加高效、快速、不受系統(tǒng)訂閱數(shù)量顯著影響的、適合大規(guī)模發(fā)布訂閱中間件系統(tǒng)的匹配方法。
發(fā)明內(nèi)容
本發(fā)明的目的就是針對現(xiàn)有技術(shù)的不足,提供一種高效、快速、不受系統(tǒng)訂閱數(shù)量顯著影響的基于本體的大規(guī)模發(fā)布訂閱流水線匹配方法。
本發(fā)明方法的具體步驟是:
步驟(1)建立事件/訂閱的本體模型:采用Resource?DescriptionFramework,即RDF本體描述語言,將事件表示成RDF事件圖、將訂閱表示成RDF訂閱圖模式,在RDF事件圖和RDF訂閱圖模式中,每個結(jié)點(diǎn)都有唯一的常量或變量標(biāo)識以及結(jié)點(diǎn)所屬概念類的類型標(biāo)識,每條弧都有一個常量標(biāo)識表示其所屬概念類的屬性標(biāo)識。
步驟(2)預(yù)處理事件/訂閱:分解RDF事件圖和RDF訂閱圖模式,以RDF事件圖和RDF訂閱圖模式中每條弧作為基本語義匹配單元,具體是:
①將RDF事件圖分解成帶類型語句的集合,帶類型語句是由對應(yīng)弧的兩端結(jié)點(diǎn)常量標(biāo)識、結(jié)點(diǎn)類型標(biāo)識、以及弧的屬性標(biāo)識組成的五元組,并將帶類型語句緩存到一個緩沖隊列中;
②將RDF訂閱圖模式分解成訂閱語句模式的集合,訂閱語句模式是由對應(yīng)弧的兩端結(jié)點(diǎn)變量標(biāo)識、受約束變量的謂詞約束條件表達(dá)式、結(jié)點(diǎn)類型標(biāo)識、以及弧的屬性標(biāo)識組成的六元組,即訂閱語句模式包含了結(jié)點(diǎn)間的類型約束和受約束變量的謂詞約束條件表達(dá)式;
步驟(3)建立訂閱語句模式索引:將所有訂閱語句模式組織成三層索引存儲結(jié)構(gòu),其中:第一層對訂閱語句模式的弧標(biāo)識建立索引;第二層對訂閱語句模式的兩端結(jié)點(diǎn)類型對建立索引;第三層對訂閱語句模式的謂詞約束條件表達(dá)式建立索引;
步驟(4)組建匹配流水線:將RDF事件圖與RDF訂閱圖模式的匹配過程分解成以下六個流水線活動過程,每個活動由分工明確的線程負(fù)責(zé)處理,線程之間相互協(xié)同,從而組成匹配流水線。具體過程是:
①讀入帶類型語句:從緩沖隊列中讀取帶類型語句,將其傳給下一處理流程;
②類型約束匹配:根據(jù)輸入的帶類型語句,查詢訂閱語句模式的三層索引存儲結(jié)構(gòu),過濾出類型約束匹配的所有訂閱語句模式,將其傳給下一處理流程;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州電子科技大學(xué),未經(jīng)杭州電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910097139.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 將發(fā)布數(shù)據(jù)發(fā)布至不同發(fā)布主機(jī)的系統(tǒng)及其方法
- 一種技術(shù)出版物內(nèi)容發(fā)布系統(tǒng)及方法
- 音/視頻流發(fā)布方法、流媒體服務(wù)器、發(fā)布端及流媒體系統(tǒng)
- 一種分布式代碼版本發(fā)布系統(tǒng)及方法
- 內(nèi)容發(fā)布方法、裝置、計算機(jī)設(shè)備以及可讀存儲介質(zhì)
- 文件發(fā)布方法和系統(tǒng)、發(fā)布服務(wù)器和文件生成裝置
- 軟件的發(fā)布質(zhì)量管理系統(tǒng)、方法以及裝置
- 信息發(fā)布方法、裝置、電子設(shè)備及計算機(jī)可讀存儲介質(zhì)
- 信息發(fā)布方法及裝置、存儲介質(zhì)、終端
- 服務(wù)發(fā)布方法及裝置、服務(wù)器、存儲介質(zhì)





