[發明專利]一種用于構建進銷項敏感商品庫的方法及裝置在審
| 申請號: | 202211448114.3 | 申請日: | 2022-11-18 |
| 公開(公告)號: | CN115775093A | 公開(公告)日: | 2023-03-10 |
| 發明(設計)人: | 劉芬;劉振宇;王志剛;林文輝;周江濤;張平印;伺彥偉 | 申請(專利權)人: | 航天信息股份有限公司;河北航天信息技術有限公司 |
| 主分類號: | G06Q10/0635 | 分類號: | G06Q10/0635;G06Q40/12 |
| 代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 劉海蓉 |
| 地址: | 100195 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 構建 進銷項 敏感 商品 方法 裝置 | ||
本發明公開了一種用于構建進銷項敏感商品庫的方法及裝置,包括:獲取企業的進銷項商品信息;根據所述企業的進銷項商品信息,確定所述企業的主銷商品和主購商品;通過計算所述主銷商品和主購商品的笛卡爾積,獲得多個進銷項商品組合;根據所述進銷項商品組合的商品編碼、置信度和支持度,獲得異常進銷項商品組合;基于所述異常進銷項商品組合的數量,計算所述企業的背離度;根據所述背離度,若確定所述企業為高風險企業,則挖掘所述企業的高風險進項商品、高風險銷項商品和高風險進銷項商品組合;由所述高風險進項商品、高風險銷項商品和高風險進銷項商品組合構建所述進銷項敏感商品庫,解決風險預判對業務人員強依賴、效率不高的問題。
技術領域
本發明涉及數據處理技術領域,具體涉及一種用于構建進銷項敏感商品庫的方法及裝置。
背景技術
目前,絕大多數分析進銷項商品差異進而識別異常企業的方法都只適用于商貿企業。對生產型企業而言,由于存在加工制造過程,進銷項商品差異大,通過比對進銷項商品分析其是否存在進銷不一致的異常行為難度很大。此外,風險企業的進銷項商品之間的關聯關系以及共性挖掘不足,業務人員在進銷不一致稅收風險防控中積累的經驗以及通過進銷項異常分析得出的結論,也都無法作為可以共享的知識進行存儲和被他人復用,使得稅收風險防控對業務人員產生極大依賴,效率低下。
發明內容
針對上述問題,本發明提供一種用于構建進銷項敏感商品庫的方法,包括:
獲取企業的進銷項商品信息;
根據所述企業的進銷項商品信息,確定所述企業的主銷商品和主購商品;
通過計算所述主銷商品和主購商品的笛卡爾積,獲得多個進銷項商品組合;根據所述進銷項商品組合的商品編碼、置信度和支持度,獲得異常進銷項商品組合;
基于所述異常進銷項商品組合的數量,計算所述企業的背離度;根據所述背離度,若確定所述企業為高風險企業,則挖掘所述企業的高風險進項商品、高風險銷項商品和高風險進銷項商品組合;由所述高風險進項商品、高風險銷項商品和高風險進銷項商品組合構建所述進銷項敏感商品庫。
進一步的,獲取企業的進銷項商品信息,包括:
從所述企業的增值稅發票和貨物明細數據,提取所述企業的進銷項商品信息。
進一步的,在獲取企業進銷項商品信息的步驟之后,還包括:
通過文本分類工具確定每個商品的商品編碼。
進一步的,根據所述企業的進銷項商品信息,確定所述企業的主銷商品和主購商品,包括:
分別匯總企業的總銷項金額和\或總進項金額;
針對每個商品編碼,計算對應商品的金額占總銷項和\或總進項金額的比例,并降序排列;
按照排序分別逐個累加商品的總銷項和\或總進項金額的比例,當所述比例大于預設閾值時,停止累加;
將被累加過的商品,確定為所述企業的主銷商品和\或主購商品。
進一步的,根據所述進銷項商品組合的商品編碼、置信度和支持度,獲得異常進銷項商品組合,包括:
若進銷項商品組合中,進項商品的商品編碼和銷項商品的商品編碼的前n位相同,則判定所述進銷項商品組合正常,否則判定所述進銷項商品組合為狀態待確定;
對判定為狀態待確定的進銷項商品組合,計算其置信度和支持度,將所述支持度和置信度均大于預設閾值的進銷項商品組合,判定為正常,其余的進銷項商品組合判定為異常。
進一步的,進銷項商品組合的置信度和支持度分別通過如下公式獲得:
置信度=某進項商品編碼出現的次數/組合總數
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于航天信息股份有限公司;河北航天信息技術有限公司,未經航天信息股份有限公司;河北航天信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211448114.3/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





