[發明專利]集團企業報表數據提取方法及系統在審
| 申請號: | 201611055861.5 | 申請日: | 2016-11-25 |
| 公開(公告)號: | CN106776822A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 武健;薛亮;路軍;王志國;邢國輝;張敏;金哲;李長青;陳煜;陳世賓;張忠棟;解來甲 | 申請(專利權)人: | 國網山東省電力公司;遠光軟件股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 濟南圣達知識產權代理有限公司 37221 | 代理人: | 黃海麗 |
| 地址: | 250001 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 集團 企業 報表 數據 提取 方法 系統 | ||
本發明公開了集團企業報表數據提取方法及系統;將企業中單列式報表與矩陣式報表進行結構拆解,單列式報表窮盡報表的所有項目、矩陣式報表窮盡報表所有行與所有列的有效組合形成報表項;將拆解后的報表項通過系統自動化剖析清理進行內容重組,消除來源于不同報表相互重復的數據,實現報表項向指標及維度的轉換,建立企業關鍵指標體系;引入源生、通用、派生值類型概念,厘清指標公式與關聯,通過公式逐層定義,建立由計算、取數等方式組成的層級計算和網狀關聯體系;通過系統ETL從報表獲取量子化的指標數據,建立維度表及事實表的關鍵指標信息資源池,達到企業報表數據提取、轉換、關聯、擴展、應用的目標。
技術領域
本發明涉及一種集團企業報表數據提取方法及系統。
背景技術
由于報表是一種半結構化文檔,現有的報表數據提取方式主要是對報表單元格數據進行特征標記的技術手段來實現報表數據的識別與提取,但這種方法對原報表侵入性強,報表更改后難以維護,同時標記無法解決單元格數據之間的關聯運算等關系以及滿足用戶動態擴展的需求。
發明內容
本發明的目的就是為了在不改造原有報表系統的條件下實現報表項數據識別、提取、關聯等問題,提供一種集團企業報表數據提取方法及系統,本發明通過對二維報表的結構拆解、內容重組、體系優化、形式再造等方式建立集團企業指標體系標準,實現報表格式與數據分離,實現半結構化文檔向全結構化數據轉變,為集團企業關鍵信息多維反映及自助分析挖掘奠定基礎。
為了實現上述目的,本發明采用如下技術方案:
集團企業報表數據提取方法,包括:
步驟(1):獲取電子集團企業報表,將集團企業報表拆解為報表項;
步驟(2):對報表項進行預處理,對預處理后的報表項按邏輯進行去重處理,消除重復數據;將處理后的報表項存儲到EXCEL表中;
步驟(3):對報表項進行維度抽取和內容重組,將含有所述報表項的EXCEL表轉化為多維的指標體系;
步驟(4):利用值類型定義指標計算公式,建立指標體系中的指標關聯關系;
步驟(5):基于指標體系從集團企業報表中抽取、轉換及加載指標數據,構建指標數據倉庫DW(Data Warehouse)。
所述步驟(1)的步驟為:
將集團企業報表中的單列式報表與矩陣式報表進行結構拆解,形成報表項;
將單列式報表進行結構拆解是指取單列式報表的所有列表頭作為報表項;
將矩陣式報表進行結構拆解是指將矩陣式報表拆分為矩陣式報表所有行表頭與矩陣式報表所有列表頭的組合。
所述單列式報表是指第一列為報表項、其他列為值類型的報表;例如:第一列為貨幣資金、結算備付金的報表項。
所述矩陣式報表是指第一列與報表頭一起構成報表項的報表;所述矩陣式報表項例如發電成本_購入電力費、售電成本_購入電力費。
所述步驟(2)的預處理包括:
(21)去掉特殊符號;
(22)去掉說明性文字;
(23)每個組合都是先引用列表頭再引用行表頭,列表頭與行表頭之間通過下劃線“_”連接;
(24)對于存在中英文的指標,先引用中文,再引用英文,英文放在括號中間;
(25)對于存在上下級關系的多層指標,按照用戶設定規則簡化為兩層指標;
所述特殊符號,包括:空格、三角形、冒號、括號、頓號、逗號、引號、星號等符號;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網山東省電力公司;遠光軟件股份有限公司,未經國網山東省電力公司;遠光軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611055861.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種相冊生成方法及終端
- 下一篇:一種時序數據管理方法、設備和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





