[發明專利]建設行業工程項目XML文件數據歸集方法及系統在審
| 申請號: | 201710440788.1 | 申請日: | 2017-06-13 |
| 公開(公告)號: | CN107273484A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 胡焱;黃寧;周金源;蘇志偉;侯曉峰;張濤;陳紅仙 | 申請(專利權)人: | 廣東中建普聯科技股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q50/08 |
| 代理公司: | 北京市盈科律師事務所11344 | 代理人: | 江錦利 |
| 地址: | 510000 廣東省廣州市天河*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 建設 行業 工程項目 xml 文件 數據 方法 系統 | ||
1.一種建設行業工程項目XML文件數據歸集方法,其特征在于,包括以下步驟:
A、基于分布式和高并發的計算機技術,獲取各客戶端上的建設行業工程項目XML文件,并提取XML文件中所有的節點屬性信息以及關鍵屬性字段;
B、根據提取的節點屬性信息將關鍵屬性字段轉換為標準文本信息;
C、分析所述標準文本信息,根據分析結果將對應工程項目進行歸集分類,對應存儲至文檔庫、材價庫、項目庫以及供應商/品牌庫中的其中一者;
D、將所存儲的工程項目按工程編碼歸集,并按照工程結構自動匯總工程項目數據層級,輸出工程指標。
2.根據權利要求1所述的建設行業工程項目XML文件數據歸集方法,其特征在于,步驟B中具體包括:
B1、對包含有關鍵屬性字段的文本信息進行IK分詞處理,并將與關鍵詞庫進行匹配,得到有效的到關鍵屬性字段;
B2、通過Simhash算法對有效的關鍵屬性字段相似對度進行計算及統計,提取出標準格式數據,并形成標準文本信息。
3.根據權利要求2所述的建設行業工程項目XML文件數據歸集方法,其特征在于,步驟D包括對標準文本信息按照工程項目數據層級進行統一編碼。
4.根據權利要求3所述的建設行業工程項目XML文件數據歸集方法,其特征在于,步驟D中工程項目數據層級包括:建設項目、單項工程、單位工程、分部分項、清單、定額、消耗量、工料機數據。
5.一種建設行業工程項目XML文件數據歸集系統,其特征在于,包括節點屬性及字段提取模塊、標準文本轉換模塊、工程項目歸集模塊、工程指標輸出模塊;其中,
節點屬性及字段提取模塊用于在各客戶端上采集建設行業工程項目XML文件,并提取XML文件中所有的節點屬性信息以及關鍵屬性字段;標準文本轉換模塊用于根據提取的節點屬性信息將關鍵屬性字段轉換為標準文本信息;工程項目歸集模塊用于分析標準文本信息,根據分析結果將對應工程項目進行歸集分類,對應存儲至文檔庫、材價庫、項目庫以及供應商/品牌庫中的其中一者;工程指標輸出模塊用于將所存儲的工程項目按工程編碼歸集,并按照工程結構自動匯總工程項目數據層級,輸出工程指標。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東中建普聯科技股份有限公司,未經廣東中建普聯科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710440788.1/1.html,轉載請聲明來源鉆瓜專利網。





