[發明專利]對反欺詐模型進行訓練的方法、識別金融欺詐行為的方法及其相關產品在審
| 申請號: | 202111154739.4 | 申請日: | 2021-09-29 |
| 公開(公告)號: | CN113888189A | 公開(公告)日: | 2022-01-04 |
| 發明(設計)人: | 猶然;蘇才禮;王云鵬;王泰 | 申請(專利權)人: | 中金金融認證中心有限公司 |
| 主分類號: | G06Q30/00 | 分類號: | G06Q30/00;G06Q40/02;G06N3/04;G06K9/62 |
| 代理公司: | 北京維昊知識產權代理事務所(普通合伙) 11804 | 代理人: | 孫新國;杜丹丹 |
| 地址: | 100054 北京市西城區菜市口*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 欺詐 模型 進行 訓練 方法 識別 金融 行為 及其 相關 產品 | ||
本發明涉及一種用于對識別金融欺詐行為的反欺詐模型進行訓練的方法及電子設備、用于識別金融欺詐行為的方法、電子設備和系統。其中,對反欺詐模型進行訓練的方法由處理器執行,并且包括:獲取關于金融欺詐行為的樣本特征作為訓練數據;將訓練數據輸入至反欺詐模型,以對反欺詐模型進行聚類訓練;以及響應于反欺詐模型輸出目標類簇,完成對反欺詐模型的聚類訓練,其中目標類簇中的簇中心點表征正常金融交易行為并且目標類簇中的各個類簇的類簇間距離和每個類簇內元素間的類簇內距離滿足預定評價指標。通過本發明的技術方案,不依賴于樣本標簽,即可實現對反欺詐模型的無監督訓練,從而為利用該反欺詐模型進行精準的金融欺詐行為識別提供有力保障。
技術領域
本發明一般地涉及金融風控技術領域。更具體地,本發明涉及一種用于對識別金融欺詐行為的反欺詐模型進行訓練的方法及電子設備、用于識別金融欺詐行為的方法、電子設備和系統。
背景技術
本部分旨在為權利要求書中陳述的本發明的實施方式提供背景或上下文。此處的描述可包括可以探究的概念,但不一定是之前已經想到或者已經探究的概念。因此,除非在此指出,否則在本部分中描述的內容對于本申請的說明書和權利要求書而言不是現有技術,并且并不因為包括在本部分中就承認是現有技術。
隨著互聯網技術的普及,基于互聯網技術的電子銀行得到了進一步發展,其已成為銀行業務中的重要板塊之一。然而,電子銀行在為廣大用戶提供豐富金融服務的同時,也帶來了新的風險。例如,近年來關于利用電子銀行業務漏洞或者采取違規手段進行欺詐洗錢交易等金融欺詐案件越來越多,已嚴重損害了銀行和國家的財產安全。隨著不法分子作案流程的專業化與技術手段的升級,采用人為規則的傳統風控模型已經很難滿足當前的風控需求。
為此,相關技術提出了立足于監督算法的機器學習模型。然而現有的機器學習模型對樣本數據的質量要求比較高,其依賴具有標簽的樣本數據。而在實際模型訓練過程中,特別是針對欺詐行為的模型訓練,有效的樣本數據比例較小且標簽時效性較差,使得訓練出的模型的實際效果較差,無法滿足實際需求。
發明內容
為了至少解決上述背景技術部分所描述的技術問題,本發明提出了一種用于對識別金融欺詐行為的反欺詐模型進行訓練的方案。利用本發明的方案,不依賴于樣本標簽,即可實現對反欺詐模型的無監督訓練。由此,本發明的方案不僅能夠克服人為規則的干預,并且有效降低了對樣本數據的需求門檻,從而為利用該反欺詐模型進行精準的金融欺詐行為識別提供有力保障。鑒于此,本發明在如下的多個方面提供解決方案。
本發明的第一方面提供了一種用于對識別金融欺詐行為的反欺詐模型進行訓練的方法,所述方法由處理器執行,并且包括:獲取關于金融欺詐行為的樣本特征作為訓練數據;將所述訓練數據輸入至所述反欺詐模型,以對所述反欺詐模型進行聚類訓練;以及響應于所述反欺詐模型輸出目標類簇,完成對所述反欺詐模型的聚類訓練,其中所述目標類簇中的簇中心點表征正常金融交易行為并且所述目標類簇中的各個類簇的類簇間距離和每個類簇內元素間的類簇內距離滿足預定評價指標。
在一個實施例中,其中獲取關于金融欺詐行為的樣本特征作為訓練數據包括:獲取關于金融交易行為的原始數據樣本集;從所述原始數據樣本集中提取關于金融欺詐行為的初始樣本特征;以及對所述初始樣本特征進行歸一化處理,并將其作為所述訓練數據。
在一個實施例中,其中對所述反欺詐模型進行聚類訓練包括:利用K均值聚類算法對所述訓練數據進行聚類訓練,并在聚類過程中循環執行以下操作:
計算所訓練的各個類簇的類簇間距離以及每個類簇內元素間的類簇內距離,以得到聚類結果;以及根據所述聚類結果調整所訓練的類簇數量,直至輸出所述目標類簇。
在一個實施例中,其中所述方法還包括:根據以下公式確定所述預定評價指標:Fmax=2DVI×CP/(DVI+CP);其中,Fmax表示取公式的最大值為所述預定評價指標,DVI表示用于表征各個類簇的類簇間距離的鄧恩指數,CP表示用于表征每個類簇內元素間的類簇內距離的緊密度指數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中金金融認證中心有限公司,未經中金金融認證中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111154739.4/2.html,轉載請聲明來源鉆瓜專利網。





