[發(fā)明專利]基于有序小枝模式的航空物流XML報(bào)文并行過濾方法有效
| 申請?zhí)枺?/td> | 201910249408.5 | 申請日: | 2019-03-29 |
| 公開(公告)號: | CN109977270B | 公開(公告)日: | 2023-07-18 |
| 發(fā)明(設(shè)計(jì))人: | 李國;莊波;李永華 | 申請(專利權(quán))人: | 中國民航大學(xué) |
| 主分類號: | G06F16/835 | 分類號: | G06F16/835;G06F9/50 |
| 代理公司: | 天津市鼎和專利商標(biāo)代理有限公司 12101 | 代理人: | 蒙建軍 |
| 地址: | 300300 天*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 有序 小枝 模式 航空 物流 xml 報(bào)文 并行 過濾 方法 | ||
本發(fā)明涉及一種基于有序小枝模式的航空物流XML報(bào)文并行過濾方法,屬于航空物流XML報(bào)文技術(shù)領(lǐng)域,其特征在于:包括:一:XPath使用路徑表達(dá)式來選取XML文檔中的節(jié)點(diǎn)或者節(jié)點(diǎn)集;二:XML文檔與小枝模式查詢進(jìn)行標(biāo)簽序列化得到標(biāo)簽序列;三:XPath訂閱表達(dá)式首先被傳遞到系統(tǒng)中,然后將XPath表達(dá)式通過XPath解析器解析成Prüfer序列,任務(wù)組調(diào)度算法將根據(jù)Prüfer序列計(jì)算每個(gè)查詢序列的任務(wù)耗時(shí),并根據(jù)任務(wù)耗時(shí)將所有任務(wù)平均分配到各個(gè)線程上;四:任務(wù)組調(diào)度算法中FiST算法通過判斷LPS(Q)是否為LPS(T)的子序列,來驗(yàn)證查詢樹Q與XML文檔樹T的匹配。
技術(shù)領(lǐng)域
本發(fā)明屬于航空物流XML報(bào)文技術(shù)領(lǐng)域,具體涉及一種基于有序小枝模式的航空物流XML報(bào)文并行過濾方法。
背景技術(shù)
隨著航空物流業(yè)的不斷發(fā)展,航空公司、代理人、機(jī)場貨站以及海關(guān)等諸多部門需要頻繁的進(jìn)行數(shù)據(jù)的交換,各個(gè)航空物流企業(yè)都有自己的信息管理系統(tǒng),2015年中國民用航空局發(fā)布了航空貨運(yùn)電子數(shù)據(jù)規(guī)范,詳細(xì)制定了XML報(bào)文的格式、內(nèi)容等信息。針對航空物流發(fā)布/訂閱系統(tǒng)中,訂閱者的數(shù)量不斷的增多,如何高效的將發(fā)布的報(bào)文準(zhǔn)確及時(shí)的分發(fā)給訂閱者是發(fā)布/訂閱系統(tǒng)的核心問題,因此設(shè)計(jì)開發(fā)一種高效的基于有序小枝模式的航空物流XML報(bào)文并行過濾方法顯得是至關(guān)重要。
發(fā)明內(nèi)容
本發(fā)明為解決公知技術(shù)中存在的技術(shù)問題而提供一種基于有序小枝模式的航空物流XML報(bào)文并行過濾方法;其針對發(fā)布/訂閱訂閱系統(tǒng)中訂閱者的數(shù)量不斷的增多特點(diǎn),本發(fā)明的方法能在多核CPU并行查詢處理中利用FiST算法的整體性匹配的優(yōu)點(diǎn),可以有效避免對有序小枝模式查詢的分解,使每個(gè)核心可以獨(dú)立的處理查詢結(jié)果,不需要后期對查詢結(jié)果的鏈接處理。該方法利用任務(wù)組調(diào)度算法對查詢序列集合進(jìn)行任務(wù)劃分,將劃分后的任務(wù)分配到各個(gè)CPU核心上執(zhí)行FiST算法。在處理大量有序小枝模式查詢的情況下,本發(fā)明可以有效提高XML報(bào)文的并行過濾效率。
本發(fā)明的目的是提供一種基于有序小枝模式的航空物流XML報(bào)文并行過濾方法,包括:
步驟一:XPath(XML?Path?Language)使用路徑表達(dá)式來選取XML文檔中的節(jié)點(diǎn)或者節(jié)點(diǎn)集。帶謂詞的XPath路徑表達(dá)式被表示成樹的形式,也稱為小枝模式。由于應(yīng)用很少涉及到所有的特征,所以討論基本上都集中在XPath的子集上,定位步驟集合為:{/a,//a,/*,//*,[]},謂詞主要討論等值謂詞。
步驟二:XML文檔與小枝模式查詢進(jìn)行標(biāo)簽序列化得到標(biāo)簽序列簡稱LPS(LabelPr?üfer?Sequence)。為了將小枝模式查詢中節(jié)點(diǎn)之間的信息包含在標(biāo)簽序列(LPS)中,F(xiàn)iST(Scalable?XML?Document?Filtering?by?Sequencing?Twig?Patterns)算法對標(biāo)簽序列(LPS)進(jìn)行屬性擴(kuò)充。擴(kuò)充后的序列為查詢序列,包含小枝模式中的所有信息。
步驟三:并行過濾方法的系統(tǒng)體系結(jié)構(gòu),系統(tǒng)在處理XML數(shù)據(jù)流之前,XPath訂閱表達(dá)式首先被傳遞到系統(tǒng)中,然后將XPath表達(dá)式通過XPath解析器解析成Prüfer序列,任務(wù)組調(diào)度算法將根據(jù)Prüfer序列計(jì)算每個(gè)查詢序列的任務(wù)耗時(shí),并根據(jù)任務(wù)耗時(shí)將所有任務(wù)平均分配到各個(gè)線程上,使每個(gè)線程的任務(wù)達(dá)到負(fù)載平衡,并且為每個(gè)線程分配一個(gè)CPU核心。FiST算法在各CPU核心上執(zhí)行查詢處理,將匹配結(jié)果直接分發(fā)給訂閱者。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國民航大學(xué),未經(jīng)中國民航大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910249408.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





