[發明專利]一種基于遷移深度學習的風險識別方法以及系統有效
| 申請號: | 201710584326.7 | 申請日: | 2017-07-18 |
| 公開(公告)號: | CN107679859B | 公開(公告)日: | 2020-08-25 |
| 發明(設計)人: | 李旭瑞;邱雪濤;趙金濤;胡奕 | 申請(專利權)人: | 中國銀聯股份有限公司 |
| 主分類號: | G06Q20/40 | 分類號: | G06Q20/40;G06N3/08 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 臧霽晨;付曼 |
| 地址: | 200135 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 遷移 深度 學習 風險 識別 方法 以及 系統 | ||
本發明涉及基于遷移深度學習的交易風險識別方法以及系統。該方法包括:對所有可能特征經過規定預處理生成向量,將向量集作為第一RBM(即受限玻爾茲曼機)的可見層輸入而由此建立一層RBM;利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行遷移加權BP調優;以及判斷BP調優后的RBM是否滿足規定條件,若滿足則不需要增加RBM層并繼續下述步驟,若不滿足規定條件,則重復進行RBM構建和遷移加權BP調優。根據本發明能夠建立更準確的判別模型并且更好地應對新興的欺詐手段。
技術領域
本發明涉及計算機技術,更具體地涉及一種基于遷移深度學習的交易風險識別方法以及系統。
背景技術
在利用機器學習進行欺詐風險識別的環節中,目前一般采用有監督的分類算法訓練偵測模型。傳統的分類學習算法需要預先進行特征選擇和計算。而這些用于訓練模型的特征很大一部分(尤其是那些經過統計得出的特征)都是根據歷史欺詐數據集中總結出的規律推演出來的,這需要大量的經驗積累,并且難免疏漏。
同時,在利用歷史交易數據進行欺詐風險識別模型訓練的時候,存在著嚴重的數據不平衡性,即帶有欺詐標簽的樣本數量遠遠小于非欺詐樣本的數量。人們總是嘗試使用多種算法和技巧來減少數據不平衡性帶來的影響,總體的思想無非大多是基于欠采樣(大大減少使用的非欺詐交易樣本數量)和過采樣(人為地擴展欺詐交易樣本的數量)。這些方法總是無法避免地破壞了現實中交易數據的分布特性,這種樣本失真問題會影響最終模型在現實應用中的效果。
另一方面,隨著信用卡支付和移動支付的普及,欺詐手段也變得五花八門。先前的一些欺詐特征可能并不適用于當前形勢,而另一部分更符合當前形勢的欺詐特征卻還未被發現。這在一定程度上影響了風險識別的準確率,尤其是對未知欺詐手段的交易風險識別能力較差。
可以看到在現有技術中存在以下這些弱點:
人工選取特征的不準確性;
為緩解數據不平衡性帶來的樣本失真;
對缺乏欺詐樣本的未知欺詐類型難以識別。
發明內容
鑒于所述問題,本發明旨在提供一種能夠緩解人為選取特征的復雜性并能夠更好識別新型欺詐手段的基于基于遷移深度學習的交易風險識別方法以及系統。
本發明的基于遷移深度學習的交易風險識別方法,其特征在于,具備下述步驟:
RBM構建步驟,對所有可能特征經過規定預處理,每一筆交易就會被映射成為一個向量,將向量集作為第一RBM的可見層輸入而由此建立一層RBM,其中,每一個RBM具有一個可見層和一個隱藏層;
BP調優步驟,利用已知欺詐樣本進行遷移學習對所述RBM構建步驟建立的RBM層進行遷移加權BP調優;
第一判斷步驟,根據上述BP調優步驟的結果判斷是否滿足規定條件,若判斷結果為滿足規定條件則不需要增加RBM層并繼續下述第二判斷步驟,若判斷結果為不滿足規定條件,則重復進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止;以及
第二判斷步驟,判斷是否隱藏層層數為奇數,若隱藏層層數為奇數,則停止構建RBM層并生成最終模型,若隱藏層層數為偶數否則刪除當前隱藏層并重復進行上述RBM構建步驟和BP調優步驟直到滿足上述規定條件為止。
優選地,在所述RBM構建步驟中利用對比散度算法對新增的RBM層進行訓練。
優選地,在所述BP調優步驟中,訓練一層RBM就進行一次BP調優,每次BP調優僅對最近一層隱藏層以及次近隱藏層和最近隱藏層之間的參數調優。
優選地,所述BP調優步驟包括下述子步驟:
利用已知欺詐樣本進行遷移學習;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀聯股份有限公司,未經中國銀聯股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710584326.7/2.html,轉載請聲明來源鉆瓜專利網。





