[發明專利]基于孤立森林算法的惡意注冊企業行為識別方法及系統在審
| 申請號: | 202011237306.0 | 申請日: | 2020-11-09 |
| 公開(公告)號: | CN112270553A | 公開(公告)日: | 2021-01-26 |
| 發明(設計)人: | 曲金濤;彭光 | 申請(專利權)人: | 浪潮軟件股份有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06F16/245;G06F16/215;G06N3/00 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 250100 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 孤立 森林 算法 惡意 注冊 企業 行為 識別 方法 系統 | ||
本發明公開了一種基于孤立森林算法的惡意注冊企業行為識別方法及系統,屬于公共信用領域,本發明要解決的技術問題為公共信用領域惡意注冊行為識別難,采用的技術方案為:該方法是使用孤立森林算法,從市場主體注冊登記信息、稅務登記信息、經營情況、日常用水用電信息、員工社保繳納信息、領票信息及開票信息中提取可度量的檢測特征,利用可度量的檢測特征構建企業數據集,再使用孤立森林算法用超平面來隨機劃分數據集,其中最早被孤立出來的點即為異常點,進而將異常企業篩選出來;具體如下:采集數據;選取特征;數據預處理;模型訓練;結果推送;反饋結果分析;模型發布。
技術領域
本發明涉及公共信用領域,具體地說是一種基于孤立森林算法的惡意注冊企業行為識別方法及系統。
背景技術
孤立森林算法:一種適用于連續數據的無監督異常檢測方法,與其他異常檢測算法通過距離、密度等量化指標來刻畫樣本間的疏離程度不同,孤立森林算法通過對樣本點的孤立來檢測異常值。具體來說,該算法利用一種名為孤立樹的二叉搜索樹結構來孤立樣本。由于異常值的數量較少且與大部分樣本的疏離性,因此,異常值會被更早的孤立出來,也即異常值會距離根節點更近,而正常值則會距離根節點有更遠的距離。此外,相較于LOF、K-means等傳統算法,孤立森林算法對高維數據有較好的魯棒性。孤立森林算法的適用場景為異常樣本少、正常樣本多的情況,惡意注冊企業在所有注冊的企業中數量占比不大,孤立森林算法適用于該場景。
傳統的孤立森林算法特征選擇基本上依靠專家經驗,該方法沒有可靠的數據支撐,容易導致模型識別準確度低,由于算法為無監督算法,結果驗證也存在一定的難度。
發明內容
本發明的技術任務是提供一種基于孤立森林算法的惡意注冊企業行為識別方法及系統,來解決公共信用領域惡意注冊行為識別難的問題。
本發明的技術任務是按以下方式實現的,一種基于孤立森林算法的惡意注冊企業行為識別方法,該方法是使用孤立森林算法,從市場主體注冊登記信息、稅務登記信息、經營情況、日常用水用電信息、員工社保繳納信息、領票信息及開票信息中提取可度量的檢測特征,利用可度量的檢測特征構建企業數據集,再使用孤立森林算法用超平面來隨機劃分數據集,其中最早被孤立出來的點即為異常點,進而將異常企業篩選出來。
作為優選,該方法具體如下:
采集數據:采集企業信息,使用數據抽取工具抽取到大數據平臺等待分析;
選取特征:根據專家經驗以及對以往惡意注冊企業的特點總結,挑選出和惡意注冊行為高度關聯的特征,并根據現有數據提煉新特征;
數據預處理:對數據進行預處理,形成標準數據集;
模型訓練:利用孤立森林算法訓練標準數據集即可得到模型結果,模型結果里的異常點集合即疑似惡意注冊企業;其中,訓練得出的模型直接用于新企業的疑似惡意注冊識別;
結果推送:將得到的疑似惡意注冊企業名單通過公共信用信息平臺推送給市場監管部門及稅務部門,兩部門在日常的監管工作中對于疑似惡意注冊企業進行重點監管,并將真實的惡意注冊企業反饋至大數據平臺;
反饋結果分析:結合市場監管及稅務部門反饋的真實惡意注冊企業結果,分析惡意注冊企業的特征,增加新的高關聯性特征,并繼續進行模型訓練;
模型發布:經過多輪訓練和反饋,模型趨于穩定,識別準確度高,即可發布模型用于新企業的惡意注冊識別。
作為優選,所述企業信息包括市場監管部門的企業登記信息、經營情況,稅務部門的稅務登記信息、領票信息及開票信息以及其余部門的日常用水用電信息以及員工社保繳納信息。
作為優選,數據預處理具體如下:
①清洗關鍵特征字段;
②對空缺值進行人工補充,不能補充的進行剔除;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮軟件股份有限公司,未經浪潮軟件股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011237306.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種鋰電池蓋帽壓焊用定位夾持機構
- 下一篇:一種益心舒片醇提浸膏的制備工藝





