[發明專利]一種基于企業關系圖譜的標簽傳播反欺詐檢測方法及系統有效
| 申請號: | 201910546944.1 | 申請日: | 2019-06-24 |
| 公開(公告)號: | CN110223168B | 公開(公告)日: | 2022-06-28 |
| 發明(設計)人: | 尹盼盼;崔樂樂;郭宏毅 | 申請(專利權)人: | 浪潮卓數大數據產業發展有限公司 |
| 主分類號: | G06Q40/02 | 分類號: | G06Q40/02;G06F16/28;G06F16/23;G06F16/36;G06F16/2458 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 孫園園 |
| 地址: | 214029 江蘇省無錫市濱*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 企業 關系 圖譜 標簽 傳播 欺詐 檢測 方法 系統 | ||
1.一種基于企業關系圖譜的標簽傳播反欺詐檢測方法,其特征在于,該方法包括如下步驟:
S1、建立企業黑名單庫:數據采集技術收集原始網絡數據,原始網絡數據保存于關系型數據庫中,篩選關系型數據庫中能夠列入反欺詐黑名單庫的表格及字段并對相關數據進行預處理,預處理包括提取、融合及去重,建立企業反欺詐黑名單庫;
S2、構建關系圖譜:篩選關系數據庫中列入關系圖譜的相關表格及字段,抽取關系型數據庫對象實體及實體關系,構建關系圖譜;具體步驟如下:
S201、關系圖譜相關表格篩選:關系型數據庫中采集的覆蓋全國的企業數據,企業數據包括企業基本信息、企業分支機構、企業變更、聯系方式、對外擔保、對外投資、動產抵押、股東及出資信息;
S202、抽取關系型數據庫中企業、法人及主要就職人員作為實體以及實體間投資、被投資、擔保及法人的各種社會關系,運用neo4j圖庫技術構建企業關系圖譜,企業關系圖譜中各節點關系根據社會關系對反欺詐的作用程度賦予不同權重,即利用黑名單庫定期更新neo4j圖庫;
S3、基于自建黑名單庫以及企業關系圖譜對企業進行反欺詐檢測:基于黑名單庫標識關系圖譜黑名單節點,提取黑名單節點連接子圖,運用標簽傳播算法識別各連接子圖中的欺詐企業節點,并預估企業屬于欺詐的概率;具體步驟如下:
S301、標注關系圖譜黑名單節點:提取建立的黑名單庫中的企業黑名單數據,查找關系圖譜中出現的黑名單企業,標注關系圖譜中的黑名單節點seed_label屬性;
S302、提取黑名單連接子圖:針對基于黑名單庫標注后的關系圖譜,基于neo4j圖庫中的Connected Components算法提取與各黑名單企業弱連通的連接子圖;具體步驟如下:
S30201、基于neo4j中的Connected Components算法查找與任一節點連接的子圖;具體步驟如下:
①、基于neo4j中的Label Propagation算法進行數據建模,設置初始種子節點信息;
②、設置進行標簽傳播的節點、節點關系、所用節點關系權重以及迭代參數;
③、調整各參數迭代運行標簽傳播算法,得到各節點理想分區結果;
S30202、在子圖中存在一個節點對應的子圖SG,對于子圖SG中的任意兩個節點u,v,存在u-...-v的路徑或存在v-...-u的路徑;
S30203、黑名單連接子圖信息以屬性保存于關系圖譜的每個節點中;
S303、對黑名單連接子圖進行標簽傳播反欺詐:針對提取的各個黑名單連接子圖,運用neo4j圖庫中的Label Propagation算法并設置算法節點、節點關系、關系權重、迭代次數以及種子節點的參數,迭代調優標簽傳播算法,得到企業所屬社區,計算企業預判為欺詐企業的概率。
2.根據權利要求1所述的基于企業關系圖譜的標簽傳播反欺詐檢測方法,其特征在于,所述步驟S1中建立企業黑名單庫的具體步驟如下:
S101、數據采集及存儲:基于數據采集技術采集覆蓋全國的企業信息、黑名單信息及各失信企業信息的數據,采集數據保存于關系型數據庫中;
S102、黑名單庫入庫對象篩選:基于建立反欺詐黑名單庫的業務目標,篩選關系型數據庫中入選黑名單庫的相關表格及入庫字段;
S103、入庫數據去重處理:針對選取的入庫數據進行數據去重,用統一社會信用代碼唯一標識企業對象;
S104、數據更新:關系型數據庫中各相關表格數據定期更新,同時同步更新企業黑名單庫中的企業信息。
3.根據權利要求1或2所述的基于企業關系圖譜的標簽傳播反欺詐檢測方法,其特征在于,所述企業黑名單庫包括非法集資企業名單、失信企業名單、工商和/或海關失信企業名單、信用中國失信金融企業名單、失信物流企業名單以及涉及司法風險企業名單。
4.根據權利要求3所述的基于企業關系圖譜的標簽傳播反欺詐檢測方法,其特征在于,所述步驟S101中企業信息包括企業名稱、社會信用代碼以及列入黑名單時間。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浪潮卓數大數據產業發展有限公司,未經浪潮卓數大數據產業發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910546944.1/1.html,轉載請聲明來源鉆瓜專利網。





