[發(fā)明專利]一種基于模糊C-均值的互聯(lián)網(wǎng)金融平臺申請欺詐行為檢測方法在審
| 申請?zhí)枺?/td> | 202011434807.8 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112560921A | 公開(公告)日: | 2021-03-26 |
| 發(fā)明(設(shè)計)人: | 江遠強 | 申請(專利權(quán))人: | 百維金科(上海)信息科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q20/40 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201913 上海市崇明區(qū)長興鎮(zhèn)潘園公*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 模糊 均值 互聯(lián)網(wǎng) 金融 平臺 申請 欺詐 行為 檢測 方法 | ||
本發(fā)明公開了一種基于模糊C?均值算法的互聯(lián)網(wǎng)金融平臺欺詐行為檢測方法,通過對采集互聯(lián)網(wǎng)平臺客戶賬戶注冊時的信息獲取實時測點數(shù)據(jù)進行Z?score歸一化和降維標準處理,劃分訓練集和驗證集,初始化模糊C?均值的參數(shù),采用模糊聚類有效性函數(shù)自動優(yōu)選初始聚類數(shù),由目標函數(shù)得到模糊C?均值聚類模型,并根據(jù)訓練集確定分類決策規(guī)則,將驗證集進行分類并與用戶的申請行為和貸后表現(xiàn)優(yōu)化模型,將優(yōu)化后的模糊C?均值模型部署至互聯(lián)網(wǎng)金融平臺后端對客戶的申請行為進行在線異常檢測監(jiān)控,對疑似異常狀態(tài)的申請發(fā)出系統(tǒng)預警,進行人工審批環(huán)節(jié)或拒絕申請;本發(fā)明實現(xiàn)預警結(jié)果準確率高,欺詐識別能力強,降低了金融欺詐風險。
技術(shù)領(lǐng)域
本發(fā)明屬于互聯(lián)網(wǎng)金融平臺行業(yè)的風控技術(shù)領(lǐng)域,具體利用模糊C-均值算法提供一種檢測互聯(lián)網(wǎng)金融平臺申請是否存在欺詐行為的方法。
背景技術(shù)
在互聯(lián)網(wǎng)金融平臺反欺詐中,傳統(tǒng)的反欺詐檢測方法主要是依賴先驗知識制定的基于預先定義的反欺詐規(guī)則和有監(jiān)督的機器學習算法,所檢測的數(shù)據(jù)級別通常是原始屬性或是細粒度級別的數(shù)據(jù)。而在當今大數(shù)據(jù)時代,金融風險維度通常是成百上千個且異常復雜,很難從單個或幾個屬性的制定有效反欺詐規(guī)則,而有監(jiān)督的機器學習又需要積累大量表現(xiàn)樣本來訓練模型,不能及時識別出新型欺詐類型。針對這種問題,基于海量數(shù)據(jù)構(gòu)建正常行為模型的異常檢測技術(shù)被廣泛采用。雖然目前針對于異常檢測的方法有很多,但是各種方法多數(shù)并不能獲得全局最優(yōu)解,且誤報率仍然有待于改善。
模糊C-均值(Fuzzy C-Means,F(xiàn)CM)算法是一種基于劃分的模糊聚類算法,它的思想就是使得被劃分到同一簇的對象之間相似度最大,而不同簇之間的相似度最小。它通過優(yōu)化目標函數(shù)得到每個樣本點對所有類中心的隸屬度,以極小化所有數(shù)據(jù)點與各聚類中心的歐式距離及模糊隸屬度的加權(quán)和為目標,不斷修正聚類中心和分類矩陣到符合終止準則,將具有類似特征的數(shù)據(jù)樣本聚為一類。模糊C-均值聚類算法由于速度快、思想簡單,得到廣泛的使用,且非常適用于互金平臺異常行為檢測識別。
但傳統(tǒng)的模糊C-均值算法應(yīng)用時存在兩個缺陷:一是初始聚類數(shù)c值只能依靠經(jīng)驗人為選取,不能自動優(yōu)選初始聚類數(shù);二是模糊C-均值算法對于樣本中的孤立點、噪音數(shù)據(jù)比較敏感,易陷入局部最優(yōu),導致分類出現(xiàn)偏差,進而影響其異常檢測的準確率和穩(wěn)定性。
發(fā)明內(nèi)容
為了解決上述技術(shù)問題,本發(fā)明中披露了一種基于模糊C-均值算法的互聯(lián)網(wǎng)金融平臺申請欺詐行為檢測方法,本發(fā)明的技術(shù)方案是這樣實施的:
一種基于模糊C-均值算法的互聯(lián)網(wǎng)金融平臺欺詐行為檢測方法,包括以下步驟:
步驟1:數(shù)據(jù)采集,從互聯(lián)網(wǎng)平臺后端采集客戶賬戶注冊時的個人基本信息及歷史行為數(shù)據(jù),以及監(jiān)測軟件中獲取實時測點數(shù)據(jù);
步驟2:對采集的數(shù)據(jù)Z-score歸一化和主成分分析降維,劃分訓練集和驗證集;
步驟3:初始化模糊C-均值的參數(shù),采用模糊聚類有效性函數(shù)確定聚類數(shù);
步驟4:根據(jù)初始隸屬度計算聚類中心,并更新隸屬度,根據(jù)目標函數(shù)收斂得到模糊C-均值聚類模型;
步驟5:根據(jù)訓練集確定分類決策規(guī)則,將驗證集進行分類結(jié)合用戶的申請行為和貸后表現(xiàn)優(yōu)化模型;
步驟6:異常在線檢測,將優(yōu)化后的模糊C-均值模型部署至互聯(lián)網(wǎng)金融平臺后端對客戶的申請行為進行在線異常檢測監(jiān)控,對疑似異常狀態(tài)的申請發(fā)出系統(tǒng)預警,進行人工審批環(huán)節(jié)或拒絕申請。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于百維金科(上海)信息科技有限公司,未經(jīng)百維金科(上海)信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011434807.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
- 基于網(wǎng)絡(luò)電視的互聯(lián)網(wǎng)業(yè)務(wù)處理方法和系統(tǒng)
- 互聯(lián)網(wǎng)業(yè)務(wù)接入網(wǎng)關(guān)的實現(xiàn)方法和系統(tǒng)
- 一種互聯(lián)網(wǎng)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 一種互聯(lián)網(wǎng)應(yīng)用交互方法、裝置及系統(tǒng)
- 一種使用互聯(lián)網(wǎng)移動攝像終端進行異地圖像拍攝的系統(tǒng)
- 一種網(wǎng)絡(luò)電視終端安全訪問互聯(lián)網(wǎng)的方法
- 利用區(qū)塊鏈保護用于互聯(lián)網(wǎng)資源分配的事務(wù)
- 互聯(lián)網(wǎng)廣告裝置及方法
- 中央管理服務(wù)器的互聯(lián)網(wǎng)連接方法及系統(tǒng)
- 互聯(lián)網(wǎng)節(jié)點中信任傳播方法、系統(tǒng)及相關(guān)產(chǎn)品





