[發明專利]基于孤立森林算法的惡意注冊企業行為識別方法及系統在審
| 申請號: | 202011237306.0 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112270553A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 曲金濤;彭光 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06F16/245;G06F16/215;G06N3/00 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 孤立 森林 算法 惡意 注冊 企業 行為 識別 方法 系統 | ||
1.一種基于孤立森林算法的惡意注冊企業行為識別方法,其特征在于,該方法是使用孤立森林算法,從市場主體注冊登記信息、稅務登記信息、經營情況、日常用水用電信息、員工社保繳納信息、領票信息及開票信息中提取可度量的檢測特征,利用可度量的檢測特征構建企業數據集,再使用孤立森林算法用超平面來隨機劃分數據集,其中最早被孤立出來的點即為異常點,進而將異常企業篩選出來。
2.根據權利要求1所述的基于孤立森林算法的惡意注冊企業行為識別方法,其特征在于,該方法具體如下:
采集數據:采集企業信息,使用數據抽取工具抽取到大數據平臺等待分析;
選取特征:根據專家經驗以及對以往惡意注冊企業的特點總結,挑選出和惡意注冊行為高度關聯的特征,并根據現有數據提煉新特征;
數據預處理:對數據進行預處理,形成標準數據集;
模型訓練:利用孤立森林算法訓練標準數據集即可得到模型結果,模型結果里的異常點集合即疑似惡意注冊企業;其中,訓練得出的模型直接用于新企業的疑似惡意注冊識別;
結果推送:將得到的疑似惡意注冊企業名單通過公共信用信息平臺推送給市場監管部門及稅務部門,兩部門在日常的監管工作中對于疑似惡意注冊企業進行重點監管,并將真實的惡意注冊企業反饋至大數據平臺;
反饋結果分析:結合市場監管及稅務部門反饋的真實惡意注冊企業結果,分析惡意注冊企業的特征,增加新的高關聯性特征,并繼續進行模型訓練;
模型發布:經過多輪訓練和反饋,模型趨于穩定,識別準確度高,即可發布模型用于新企業的惡意注冊識別。
3.根據權利要求1所述的基于孤立森林算法的惡意注冊企業行為識別方法,其特征在于,所述企業信息包括市場監管部門的企業登記信息、經營情況,稅務部門的稅務登記信息、領票信息及開票信息以及其余部門的日常用水用電信息以及員工社保繳納信息。
4.根據權利要求1所述的基于孤立森林算法的惡意注冊企業行為識別方法,其特征在于,數據預處理具體如下:
①清洗關鍵特征字段;
②對空缺值進行人工補充,不能補充的進行剔除;
③對于異常值進行人工修改,不能修改的進行剔除;
④特征計算:根據特征計算公式計算形成要提煉的特征;
⑤特征歸一化處理:將特征進行標準化處理,形成標準數據集。
5.根據權利要求1-4中任一所述的基于孤立森林算法的惡意注冊企業行為識別方法,其特征在于,反饋結果分析具體如下:
結合市場監管及稅務部門反饋的真實惡意注冊企業結果,計算每個特征和惡意注冊行為的相關性,剔除關聯度低及無關聯的特征,提高關聯度高的特征比重;
分析惡意注冊企業的其余特征,增加新的高關聯性特征;
重新進行模型訓練,使識別結果更加準確。
6.一種基于孤立森林算法的惡意注冊企業行為識別系統,其特征在于,該系統包括,
數據采集模塊,用于采集企業信息,使用數據抽取工具抽取到大數據平臺等待分析;其中,企業信息包括市場監管部門的企業登記信息、經營情況,稅務部門的稅務登記信息、領票信息及開票信息以及其余部門的日常用水用電信息以及員工社保繳納信息;
特征選取模塊,用于根據專家經驗以及對以往惡意注冊企業的特點總結,挑選出和惡意注冊行為高度關聯的特征,并根據現有數據提煉新特征;
數據預處理模塊,用于對數據進行預處理,形成標準數據集;
模型訓練模塊,用于利用孤立森林算法訓練標準數據集即可得到模型結果,模型結果里的異常點集合即疑似惡意注冊企業;其中,訓練得出的模型直接用于新企業的疑似惡意注冊識別;
結果推送模塊,用于將得到的疑似惡意注冊企業名單通過公共信用信息平臺推送給市場監管部門及稅務部門,兩部門在日常的監管工作中對于疑似惡意注冊企業進行重點監管,并將真實的惡意注冊企業反饋至大數據平臺;
反饋結果分析模塊,用于結合市場監管及稅務部門反饋的真實惡意注冊企業結果,分析惡意注冊企業的特征,增加新的高關聯性特征,并繼續進行模型訓練;
模型發布模塊,用于經過多輪訓練和反饋,模型趨于穩定,識別準確度高,即可發布模型用于新企業的惡意注冊識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011237306.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鋰電池蓋帽壓焊用定位夾持機構
- 下一篇:一種益心舒片醇提浸膏的制備工藝





