[發(fā)明專利]建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201710440788.1 | 申請日: | 2017-06-13 |
| 公開(公告)號: | CN107273484A | 公開(公告)日: | 2017-10-20 |
| 發(fā)明(設(shè)計(jì))人: | 胡焱;黃寧;周金源;蘇志偉;侯曉峰;張濤;陳紅仙 | 申請(專利權(quán))人: | 廣東中建普聯(lián)科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/08 |
| 代理公司: | 北京市盈科律師事務(wù)所11344 | 代理人: | 江錦利 |
| 地址: | 510000 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 建設(shè) 行業(yè) 工程項(xiàng)目 xml 文件 數(shù)據(jù) 方法 系統(tǒng) | ||
技術(shù)領(lǐng)域
本發(fā)明屬于建設(shè)行業(yè)工程項(xiàng)目文件處理領(lǐng)域,具體涉及一種建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方法及系統(tǒng)
背景技術(shù)
XML文件作為建設(shè)行業(yè)項(xiàng)目工程數(shù)據(jù)存儲(chǔ)的主要文件類型之一,已經(jīng)被廣泛使用。但是對于XML文件內(nèi)部的數(shù)據(jù)而言,建設(shè)行業(yè)還沒有一個(gè)通用、標(biāo)準(zhǔn)的歸集方案,因此建設(shè)行業(yè)的各企業(yè)主要按照各自的意愿設(shè)置各種標(biāo)準(zhǔn)進(jìn)行歸集。這些歸集標(biāo)準(zhǔn)不統(tǒng)一的XML文件數(shù)據(jù)在后期的應(yīng)用中難以自動(dòng)進(jìn)行識別及分析,因此對分析工作帶來了很大困難。現(xiàn)有的解決方案主要仍是通過人工進(jìn)行識別及分析,效率很低且成本過高。
故而,現(xiàn)有技術(shù)需要進(jìn)一步發(fā)展及改進(jìn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于解決建設(shè)行業(yè)中缺少XML文件數(shù)據(jù)的通用歸集方案的問題,由此公開一種建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方法。同時(shí),本發(fā)明還相應(yīng)公開一種建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集系統(tǒng)。
為了實(shí)現(xiàn)以上目的,本發(fā)明公開的一種建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方法,包括以下步驟:
A、基于分布式和高并發(fā)的計(jì)算機(jī)技術(shù),獲取各客戶端上的建設(shè)行業(yè)工程項(xiàng)目XML文件,并提取XML文件中所有的節(jié)點(diǎn)屬性信息以及關(guān)鍵屬性字段;
B、根據(jù)提取的節(jié)點(diǎn)屬性信息將關(guān)鍵屬性字段轉(zhuǎn)換為標(biāo)準(zhǔn)文本信息;
C、分析所述標(biāo)準(zhǔn)文本信息,根據(jù)分析結(jié)果將對應(yīng)工程項(xiàng)目進(jìn)行歸集分類,對應(yīng)存儲(chǔ)至文檔庫、材價(jià)庫、項(xiàng)目庫以及供應(yīng)商/品牌庫中的其中一者;
D、將所存儲(chǔ)的工程項(xiàng)目按工程編碼歸集,并按照工程結(jié)構(gòu)自動(dòng)匯總工程項(xiàng)目數(shù)據(jù)層級,輸出工程指標(biāo)。
本發(fā)明的進(jìn)一步方案中,步驟B中具體包括:
B1、對包含有關(guān)鍵屬性字段的文本信息進(jìn)行IK分詞處理,并將與關(guān)鍵詞庫進(jìn)行匹配,得到有效的到關(guān)鍵屬性字段;
B2、通過Simhash算法對有效的關(guān)鍵屬性字段相似對度進(jìn)行計(jì)算及統(tǒng)計(jì),提取出標(biāo)準(zhǔn)格式數(shù)據(jù),并形成標(biāo)準(zhǔn)文本信息。
本發(fā)明的進(jìn)一步方案中,步驟D包括對標(biāo)準(zhǔn)文本信息按照工程項(xiàng)目數(shù)據(jù)層級進(jìn)行統(tǒng)一編碼。
本發(fā)明的進(jìn)一步方案中,步驟D的工程項(xiàng)目數(shù)據(jù)層級包括:建設(shè)項(xiàng)目、單項(xiàng)工程、單位工程、分部分項(xiàng)、清單、定額、消耗量、工料機(jī)數(shù)據(jù)。
本發(fā)明相應(yīng)公開的一種建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集系統(tǒng),包括節(jié)點(diǎn)屬性及字段提取模塊、標(biāo)準(zhǔn)文本轉(zhuǎn)換模塊、工程項(xiàng)目歸集模塊、工程指標(biāo)輸出模塊;其中,
節(jié)點(diǎn)屬性及字段提取模塊用于在各客戶端上采集建設(shè)行業(yè)工程項(xiàng)目XML文件,并提取XML文件中所有的節(jié)點(diǎn)屬性信息以及關(guān)鍵屬性字段;標(biāo)準(zhǔn)文本轉(zhuǎn)換模塊用于根據(jù)提取的節(jié)點(diǎn)屬性信息將關(guān)鍵屬性字段轉(zhuǎn)換為標(biāo)準(zhǔn)文本信息;工程項(xiàng)目歸集模塊用于分析標(biāo)準(zhǔn)文本信息,根據(jù)分析結(jié)果將對應(yīng)工程項(xiàng)目進(jìn)行歸集分類,對應(yīng)存儲(chǔ)至文檔庫、材價(jià)庫、項(xiàng)目庫以及供應(yīng)商/品牌庫中的其中一者;工程指標(biāo)輸出模塊用于將所存儲(chǔ)的工程項(xiàng)目按工程編碼歸集,并按照工程結(jié)構(gòu)自動(dòng)匯總工程項(xiàng)目數(shù)據(jù)層級,輸出工程指標(biāo)。
有益效果:本發(fā)明通過提取XML文件數(shù)據(jù)的節(jié)點(diǎn)屬性信息以及關(guān)鍵屬性字段,對工程項(xiàng)目進(jìn)行分類歸集分類及編碼歸集,并按照工程項(xiàng)目結(jié)構(gòu)自動(dòng)匯總及輸出工程指標(biāo),從而實(shí)現(xiàn)了一種高效的建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方案,為建設(shè)行業(yè)XML文件數(shù)據(jù)的通用歸集提供了參考案例。此外,本發(fā)明還具有歸集效率更高、更準(zhǔn)確等有益效果。
附圖說明
圖1是實(shí)施例一公開的建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方法整體流程示意圖。
圖2是實(shí)施例二公開的建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集系統(tǒng)結(jié)構(gòu)框圖。
具體實(shí)施方式
為了便于本領(lǐng)域技術(shù)人員理解,下面將結(jié)合附圖以及實(shí)施例對本發(fā)明進(jìn)行進(jìn)一步描述。
實(shí)施例一
請參閱圖1,實(shí)施例一公開的一種建設(shè)行業(yè)工程項(xiàng)目XML文件數(shù)據(jù)歸集方法,主要包括以下步驟S100至S400:
S100、基于分布式和高并發(fā)的計(jì)算機(jī)技術(shù),獲取各客戶端上的建設(shè)行業(yè)工程項(xiàng)目XML文件,并提取XML文件中所有的節(jié)點(diǎn)屬性信息以及關(guān)鍵屬性字段。
步驟S100中的節(jié)點(diǎn)屬性信息用于表征該節(jié)點(diǎn)中字段的屬性,譬如某工程項(xiàng)目XML文件中的節(jié)點(diǎn)屬性信息有:序號、定額編號、項(xiàng)目名稱、單位、數(shù)量、儀表名稱、單位定額值、合計(jì)值等;其中節(jié)點(diǎn)屬性信息的“項(xiàng)目名稱”有以下關(guān)鍵屬性字段:保護(hù)倒換測試、敷設(shè)管道光纜、光纜割接、光纖連接、光纜中繼段雙窗口測試等。
S200、根據(jù)提取的節(jié)點(diǎn)屬性信息將關(guān)鍵屬性字段轉(zhuǎn)換為標(biāo)準(zhǔn)文本信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東中建普聯(lián)科技股份有限公司,未經(jīng)廣東中建普聯(lián)科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710440788.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:稀疏數(shù)據(jù)的訪問方法及系統(tǒng)
- 下一篇:一種基于可配置數(shù)據(jù)庫的數(shù)據(jù)存儲(chǔ)結(jié)構(gòu)及數(shù)據(jù)庫重置方法
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)字化專業(yè)建設(shè)評估方法
- 一種基于電網(wǎng)的時(shí)序建設(shè)安全穩(wěn)定的評估方法
- 一種自動(dòng)獲取團(tuán)隊(duì)建設(shè)方案的方法
- 一種城市建設(shè)氣候變化緊迫?適應(yīng)度的關(guān)聯(lián)映射計(jì)算方法
- 一種確定大橋建設(shè)方案的方法
- 一種智慧燃?xì)饩W(wǎng)建設(shè)系統(tǒng)
- 一種智能電網(wǎng)建設(shè)系統(tǒng)
- 一種產(chǎn)業(yè)園建設(shè)管理系統(tǒng)
- 一種基于城市關(guān)聯(lián)分析的多因素海綿城市建設(shè)及評估方法
- 一種提高生態(tài)場地生態(tài)價(jià)值的建設(shè)方法
- 運(yùn)動(dòng)行業(yè)卡
- 支持行業(yè)應(yīng)用空中下載的方法、系統(tǒng)及裝置
- 行業(yè)特征詞確定方法和裝置及行業(yè)文本聚類方法和服務(wù)器
- 機(jī)箱(行業(yè)版)
- 鐵路行業(yè)服
- 酒精行業(yè)及淀粉行業(yè)乏汽余熱回收裝置
- 文本分類方法、系統(tǒng)、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 基于行業(yè)畫像的行業(yè)利潤預(yù)測方法、系統(tǒng)、介質(zhì)及終端
- 一種行業(yè)主體審核方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種選擇目標(biāo)行業(yè)方法及系統(tǒng)
- 工程項(xiàng)目系統(tǒng)操作信息采集裝置
- 一種工程項(xiàng)目建設(shè)系統(tǒng)
- 一種工程項(xiàng)目流程管理系統(tǒng)及其管理方法
- 工程項(xiàng)目設(shè)計(jì)定價(jià)方法和裝置、項(xiàng)目管理設(shè)備和存儲(chǔ)介質(zhì)
- 城市工程管理平臺(tái)的大型工程顯示方法
- 一種工程項(xiàng)目管理系統(tǒng)、管理方法、APP及存儲(chǔ)介質(zhì)
- 工程項(xiàng)目造價(jià)、招標(biāo)、咨詢的綜合管理系統(tǒng)
- 基于互聯(lián)網(wǎng)的工程項(xiàng)目管理方法、裝置及云平臺(tái)
- 一種基于大數(shù)據(jù)的工程項(xiàng)目風(fēng)險(xiǎn)評估系統(tǒng)
- 一種建筑工程用信息管理系統(tǒng)
- Java中的XML類型
- 數(shù)據(jù)庫中XML模式的原地演進(jìn)
- 在標(biāo)記語言環(huán)境中使用可撤消命令來編輯文檔的文檔處理和管理方法
- XML文檔管理系統(tǒng)及其方法與XML文檔訪問控制方法
- 用于處理用于在XML數(shù)據(jù)庫中存儲(chǔ)的非XML文檔的方法和系統(tǒng)
- 一種XML元數(shù)據(jù)對象化解析方法及系統(tǒng)
- 一種XML信息獲取方法和系統(tǒng)
- 將XML文檔自動(dòng)轉(zhuǎn)化為OML文檔的轉(zhuǎn)換方法及裝置
- XML數(shù)據(jù)的處理方法和裝置
- 一種XML注入漏洞檢測與防御方法





