[發明專利]一種稅務大數據模型的構建方法及系統在審
| 申請號: | 201911354990.8 | 申請日: | 2019-12-25 |
| 公開(公告)號: | CN111260452A | 公開(公告)日: | 2020-06-09 |
| 發明(設計)人: | 陶振;范鋼;吳偉剛;田宜喜;謝宇;張玉魁;陳榮興 | 申請(專利權)人: | 航天信息股份有限公司 |
| 主分類號: | G06Q40/00 | 分類號: | G06Q40/00;G06Q10/06;G06F16/28;G06F16/248 |
| 代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 姜麗樓 |
| 地址: | 100195 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 稅務 數據模型 構建 方法 系統 | ||
1.一種稅務大數據模型的構建方法,所述方法包括:
接收并解析用戶提供的風險指標內部數據需求,獲得取數范圍及數據處理順序;
根據所述內部數據需求建立分析過程表;所述分析過程表包括事實表和維度表;
將所述事實表和維度表聚合,獲得寬表;對所述寬表分析處理,形成結果分析表;
定義數據模型,根據所述結果分析表確定預設的初始模型所需的維度;
設定模型中需要計算的維度字段,并設定模型更新時間;
根據所述模型創建數據立方體。
2.根據權利要求1所述的方法,其特征在于,所述維度表構建方法包括:
設置所述維度表主鍵;所述主鍵是唯一的;
設置所述維度表容量上限。
3.根據權利要求1所述的方法,其特征在于,所述寬表分析處理方法包括:
根據不同的業務需求增加是否為新辦企業的判斷字段;
分析包含業務所需的各個角度和創建模型所需的所有維度。
4.根據權利要求1所述的方法,其特征在于:
所述數據模型包括星型或雪花型。
5.根據權利要求1所述的方法,其特征在于:
所述分析過程表包括納稅人相關信息表以及發票相關信息表;
所述維度包括強制維度和層次維度;
所述寬表中所有字段都納入強制維度。
6.根據權利要求1所述的方法,其特征在于,所述設定模型中需要計算的維度字段方法包括:
確定需要計算的模塊的字段及計算方式;
所述需要計算的模塊包括納稅人的進項發票數量、銷項發票數量、進項發票金額、銷項發票金額、進項發票稅額、銷項發票稅額、作廢發票金額以及其他異常發票相關數據。
7.根據權利要求1所述的方法,其特征在于,所述設定模型更新時間方法包括:
設置單獨的分區時間列,根據需要選擇分區時間字段的日期格式,采用時間分段方式添加新的發票數據;
或者設置完成自動更新時間后,在規定的時間添加新的發票數據。
8.根據權利要求5所述的方法,其特征在于,所述確定構建模型所需的維度方法還包括:
設置強制維度和層次維度以及檢查行鍵;
所述設置強制維度和層次維度的方法包括創建層級機構的聚合組,刪除強制維度中不需要的維度;
所述檢查行鍵的方法包括將參與數據立方體子集生成的維度添加至數據立方體的行鍵中,所述數據立方體子集為數據立方體每種維度組合的預計算結果;
設置每個行鍵的列值編碼方法;
將過濾條件中出現頻次最高的維度放置于行鍵前面,按照層級結構將發票類字段排布在所述出現頻次最高的維度后面。
9.一種稅務大數據模型的構建系統,所述系統包括:
需求分析單元、分析結果表構建單元、數據模型構建單元、維度設置單元、計算模塊維度設置單元、更新時間設置單元以及模型生成單元;
所述需求分析單元用于接收并解析用戶提供的風險指標內部數據需求,獲得取數范圍及數據處理順序;
所述分析結果表構建單元用于根據所述內部數據需求建立分析過程表,將所述分析過程表中的事實表和維度表聚合,獲得寬表;對所述寬表分析處理,形成結果分析表;
所述數據模型構建單元用于定義數據模型;
所述維度設置單元用于根據所述結果分析表確定預設的初始模型所需的維度;
所述計算模塊維度設置單元用于設定模型中需要計算的維度字段;
所述更新時間設置單元用于設定模型更新時間;
所述模型生成單元用于根據所述模型創建數據立方體。
10.根據權利要求9所述的系統,其特征在于:
所述分析結果表構建單元設置所述維度表主鍵;所述主鍵是唯一的;
所述分析結果表構建單元設置所述維度表容量上限。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天信息股份有限公司,未經航天信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911354990.8/1.html,轉載請聲明來源鉆瓜專利網。





