[發明專利]一種確定商品的推薦稅收分類編碼的系統和方法有效
| 申請號: | 201711450703.4 | 申請日: | 2017-12-27 |
| 公開(公告)號: | CN110019404B | 公開(公告)日: | 2022-01-07 |
| 發明(設計)人: | 劉丹;范鋼;潘競旭;田宜喜;謝宇;張玉魁;陳榮興 | 申請(專利權)人: | 航天信息股份有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06Q40/00 |
| 代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 郭一斐;葉萬東 |
| 地址: | 100195 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 確定 商品 推薦 稅收 分類 編碼 系統 方法 | ||
1.一種確定商品的推薦稅收分類編碼的系統,其特征在于,所述系統包括:
發票數據采集單元,其用于采集納稅人信息和增值稅發票數據;
發票數據清洗單元,其用于將發票數據采集單元采集的增值稅發票數據進行預處理,清洗所述發票數據中沒有利用價值的冗余數據;
發票數據分析單元,其用于針對發票數據中的每一種商品,計算所述商品曾經開出的每一種分類編碼的使用率,其計算公式為:
其中,Pi是每種商品第i種分類編碼的使用率,Ai是每種商品第i種分類編碼的全部納稅人的開票總次數,B是每種商品的全部分類編碼的全部納稅人的開票次數的總和,1≤i≤n,n是自然數;
發票模型建立單元,其用于根據納稅人在每種商品的分類編碼的使用率上的權重值大小對每種商品的分類編碼的使用率進行校正,并對校正后的分類編碼使用率進行歸一化以建立數學模型,其中,當商品所屬行業和納稅人經營范圍都與商品相符時,設置使用率的權重值為α,當商品所屬行業和納稅人經營范圍中有一個與商品相符時,設置使用率的權重值為β,當商品所屬行業和納稅人經營范圍與商品都不相符時,設置使用率的權重值為γ,則對每種商品的分類編碼的使用率進行校正的公式和數學模型的公式分別為:
其中,Pi′是進行校正后的每種商品第i種分類編碼的使用率,Xi是每種商品第i種分類編碼中權重值為α的納稅人的開票總次數,Yi是每種商品第i種分類編碼中權重值為β的納稅人的開票總次數,Zi是每種商品第i種分類編碼中權重值為γ的納稅人的開票總次數,B是每種商品的全部分類編碼的全部納稅人的開票次數的總和,Pi是每種商品第i種分類編碼進行歸一化后的使用率,是每種商品的每種分類編碼進行校正后的使用率的和,1≤i≤n,n是自然數;
測試單元,其用于將商品分類編碼已知的發票數據導入建立的發票模型并設置不同的α、β和γ后進行測試,求解發票模型中的商品所述行業和經營范圍對使用率的權重值α、β和γ的最優值,并基于確定的權重值的最優值計算每種商品的每種稅收分類編碼的使用率以確定每種商品的推薦分類編碼。
2.根據權利要求1所述的系統,其特征在于,所述發票數據采集單元采集的數據包括金稅三期、開票軟件和發票平臺的納稅人信息和增值稅發票數據。
3.根據權利要求1所述的系統,其特征在于,所述發票數據清洗單元的預處理是將發票數據采集單元采集的發票數據導入Hadoop數據平臺,使用Spark程序清洗發票數據中的冗余數據。
4.根據權利要求1所述的系統,其特征在于,所述系統還包括商品稅收分類編碼推薦單元,其用于對每種商品的不同分類編碼進行歸一化后的使用率排序,并將最大值對應的稅收分類編碼作為推薦稅收分類編碼反饋至開票人客戶端。
5.根據權利要求1所述的系統,其特征在于,發票模型建立單元的α的值是1,β值是0.5,γ值是0.2。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天信息股份有限公司,未經航天信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711450703.4/1.html,轉載請聲明來源鉆瓜專利網。





