[發明專利]一種預測企業涉稅風險的方法及裝置在審
| 申請號: | 201810431394.4 | 申請日: | 2018-05-08 |
| 公開(公告)號: | CN108647818A | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 李潛 | 申請(專利權)人: | 山東浪潮通軟信息科技有限公司 |
| 主分類號: | G06Q10/04 | 分類號: | G06Q10/04;G06Q10/06;G06Q40/00;G06K9/62 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山東省*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 風險預測 特征屬性集合 稅務數據 集合 映射關系 子集合 預測 訓練數據樣本 方法和裝置 決策樹分析 特征屬性 用戶體驗 決策樹 構建 評估 外部 | ||
1.一種預測企業涉稅風險的方法,其特征在于,包括:
接收外部定義的涉稅風險預測集合、稅務數據特征屬性集合以及所述稅務數據特征屬性集合中每一個特征屬性對應的特征范圍子集合;
構建所述特征值子集合中每一個特征范圍與所述涉稅風險預測集合中的一個涉稅風險預測值之間的映射關系;
按照所述稅務數據特征屬性集合,對訓練數據樣本集合進行提取;
根據提取的結果和所述映射關系,生成風險預測決策樹;
當選定待評估企業時,利用所述風險預測決策樹分析所述待評估企業的涉稅數據,進行涉稅風險預測。
2.根據權利要求1所述的方法,其特征在于,
所述對訓練數據樣本集合進行提取,包括:
從所述訓練數據樣本集合中,提取所述稅務數據特征屬性集合中包含的特征屬性以及對應的特征值;
將提取出的同一類特征屬性以及對應的特征值,構成一個分類訓練樣本集合。
3.根據權利要求2所述的方法,其特征在于,所述根據提取的結果和映射關系,生成風險預測決策樹,包括:
根據所述映射關系,確定所述分類訓練樣本集合中每一個特征值對應的涉稅風險預測值;
根據下述信息熵計算公式,計算所述分類訓練樣本集合的信息熵;
其中,Entropy(D)表征分類訓練樣本集合D的信息熵;c表征所述分類訓練樣本集合D對應的涉稅風險預測值的個數;Pi表征第i個涉稅風險預測值對應的特征值個數在所述分類訓練樣本集合D中所占的比例;
根據下述特征信息熵計算公式,計算所述訓練數據樣本集合中每一個特征屬性的特征信息熵;
其中,EntropyA(S)表征訓練數據樣本集合S中特征屬性A的特征信息熵;k表征特征屬性A對應的不同特征值的個數;|Sj|表征特征屬性A取第j個特征值的個數;|S|表征訓練數據樣本集合S中特征值的總個數;PAji表征特征屬性A取第j個特征值時,對應的第i個涉稅風險預測值對應的特征值個數與訓練數據樣本集合S中特征屬性A取第j個特征值的總個數;
按照下述信息增益計算公式,計算每一個特征屬性的信息增益;
ΔEntropyA(D)=Entropy(D)-EntropyA(S)
其中,ΔEntropyA(D)表征特征屬性A的信息增益;Entropy(D)表征與特征屬性A相關的分類訓練樣本集合的信息熵;EntropyA(S)表征特征屬性A的特征信息熵;
根據計算出的所述信息增益,為每一個所述特征屬性分配層級;
按照所述特征屬性的層級以及所述映射關系,生成風險預測決策樹。
4.根據權利要求3所述的方法,其特征在于,
所述根據計算出的所述信息增益,為每一個所述特征屬性分配層級,包括:
按照所述特征屬性的信息增益由大到小的順序,由高層級到低層級分配所述特征屬性。
5.根據權利要求3所述的方法,其特征在于,所述按照所述特征屬性的層級以及所述映射關系,生成風險預測決策樹,包括:
將所述特征屬性對應的所述特征范圍子集合中的每一個特征范圍分配到所述特征屬性的層級;
從最高層級到最低層級,每一個層級取一個所述特征范圍構成所述風險預測決策樹的一個枝杈;
按照所述映射關系,統計每一個所述枝杈的涉稅風險預測值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東浪潮通軟信息科技有限公司,未經山東浪潮通軟信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810431394.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種能耗負荷的預測方法及預測系統
- 下一篇:一種煤堆管理系統
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





