[發(fā)明專利]基于SPARK的小規(guī)模納稅人年應稅銷售額的監(jiān)控方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201611219202.0 | 申請日: | 2016-12-26 |
| 公開(公告)號: | CN108242019A | 公開(公告)日: | 2018-07-03 |
| 發(fā)明(設計)人: | 劉丹;陳益夢;范鋼;田宜喜;潘竟旭;謝宇;陳懿 | 申請(專利權)人: | 航天信息股份有限公司 |
| 主分類號: | G06Q40/00 | 分類號: | G06Q40/00;G06F17/30 |
| 代理公司: | 北京工信聯(lián)合知識產權代理有限公司 11266 | 代理人: | 郭一斐 |
| 地址: | 100195 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 銷項發(fā)票 信息表 監(jiān)控 字段信息 關系型數(shù)據(jù)庫 關聯(lián) 對比結果 計算過程 注冊登記 數(shù)據(jù)處理 達標 大數(shù)據(jù) 事實表 冗余 清洗 分類 創(chuàng)建 分析 | ||
本發(fā)明設計實現(xiàn)了一種基于大數(shù)據(jù)SPARK框架對小規(guī)模納稅人年應稅銷售額進行監(jiān)控的方法,通過分析小規(guī)模納稅人的銷項發(fā)票數(shù)據(jù)來計算其年應稅銷售額,進而監(jiān)控小規(guī)模納稅人是否達標,并使用sparkSQL代替關系型數(shù)據(jù)庫的數(shù)據(jù)處理計算過程,提高了監(jiān)控的準確性和計算速率。所述方法包括:獲取小規(guī)模納稅人的銷項發(fā)票表和納稅人信息表;對無關的、冗余的以及雜亂的字段信息進行清洗;關聯(lián)小規(guī)模納稅人的銷項發(fā)票表和納稅人信息表,獲取關聯(lián)后信息表內注冊登記時間在一年以上的所有小規(guī)模納稅人的字段信息;進行小規(guī)模納稅人的分類并創(chuàng)建納稅人事實表;計算每個小規(guī)模納稅人的年應稅銷售額;與對應的達標認定標準進行對比,并對對比結果進行監(jiān)控。
技術領域
本發(fā)明涉及稅務監(jiān)管領域,并且更具體地,涉及一種基于大數(shù)據(jù)SPARK框架對小規(guī)模納稅人年應稅銷售額進行監(jiān)控的方法及系統(tǒng)。
背景技術
在稅務監(jiān)管的工作中,稅務人員發(fā)現(xiàn)很多小規(guī)模納稅人達到一般納稅人認定標準后,不但不申請一般納稅人資格認定,反而采取各種辦法來規(guī)避,造成部分達標小規(guī)模納稅人申報額偏低、虛假注銷、非正常戶增加、注銷稅務登記后遲遲不辦理新的營業(yè)執(zhí)照及稅務登記的現(xiàn)象。
達標小規(guī)模納稅人不愿意轉換為一般納稅人的原因如下:
1、行業(yè)的特殊性使一般納稅人資格認定后稅負有較大增加;
2、一般納稅人簡易征收辦法存在局限性;
3、對增值稅專用發(fā)票取得的非依賴性;
4、個別行業(yè)經營核算體制與增值稅一般納稅人核算原則發(fā)生沖突。
為了加大對達標小規(guī)模納稅人的管理力度,除了加強政策的宣傳輔導和加強注銷業(yè)戶審核以外,還需要加強對小規(guī)模納稅人的有計劃、有重點的監(jiān)控。
SPARK是基于內存的,是云計算領域的繼Hadoop之后的下一代的最熱門的通用的并行計算框架開源項目。SPARK最大的優(yōu)勢在于速度,在迭代處理計算方面比Hadoop快100倍以上;SPARK另外一個無可取代的優(yōu)勢是:“One Stack to rule them all”,SPARK采用一個統(tǒng)一的技術堆棧解決了大數(shù)據(jù)計算的所有核心問題,這直接奠定了其大數(shù)據(jù)領域的核心地位。
隨著小規(guī)模納稅人轉變?yōu)橐话慵{稅人標準的降低以及稅務部門網絡化管理進度的加快,小規(guī)模納稅人的發(fā)票數(shù)據(jù)量大幅度增加,傳統(tǒng)的數(shù)據(jù)處理方式的弊端開始顯現(xiàn),為了達到高效監(jiān)控的目的,勢必要引入新的數(shù)據(jù)處理手段。
發(fā)明內容
為了解決上述問題,根據(jù)本發(fā)明的一方面,提供一種基于大數(shù)據(jù)SPARK框架對小規(guī)模納稅人年應稅銷售額進行監(jiān)控的方法,包括:
獲取電子底賬庫中小規(guī)模納稅人的銷項發(fā)票表;
獲取金稅三期庫中小規(guī)模納稅人的納稅人信息表;
對銷項發(fā)票表和納稅人信息表中無關的、冗余的以及雜亂的字段信息進行清洗;
利用納稅人識別號字段和開業(yè)登記日期字段將銷項發(fā)票表和納稅人信息表進行關聯(lián),獲取關聯(lián)后信息表內注冊登記時間在一年以上的所有小規(guī)模納稅人的所有字段信息,并存儲至SPARK框架下的數(shù)據(jù)倉庫表中;
使用SPARK框架下的分析工具sparkSQL調用行業(yè)明細代碼字段和經營范圍字段對注冊登記時間在一年以上的小規(guī)模納稅人進行分類并創(chuàng)建納稅人事實表以存儲分類結果;
使用分析工具sparkSQL計算每個小規(guī)模納稅人的年應稅銷售額;
將小規(guī)模納稅人的年應稅銷售額與其對應的達標認定標準進行對比,并對對比結果進行監(jiān)控。
優(yōu)選地,所述無關的、冗余的以及雜亂的字段信息為與小規(guī)模納稅人年應稅銷售額計算無關的字段、字段內數(shù)據(jù)不完整的字段以及格式不統(tǒng)一的字段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天信息股份有限公司,未經航天信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611219202.0/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產組合管理或者基金管理
G06Q40-08 .保險,例如,風險分析或養(yǎng)老金





