[發(fā)明專利]基于RNN的反洗錢模型的訓練方法、裝置、設備及介質在審
| 申請?zhí)枺?/td> | 202010794245.1 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111915437A | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設計)人: | 蘭沖;郭天佑;汪亞男;肖和兵;李元;夏爾科 | 申請(專利權)人: | 深圳前海微眾銀行股份有限公司;香港科技大學 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產(chǎn)權代理事務所 44287 | 代理人: | 晏波 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 rnn 洗錢 模型 訓練 方法 裝置 設備 介質 | ||
本發(fā)明涉及金融科技技術領域,公開了一種基于RNN的反洗錢模型的訓練方法、裝置、設備及介質。該方法包括:獲取訓練樣本集,訓練樣本集包括樣本客戶的第一交易特征序列數(shù)據(jù)、第一客戶屬性特征數(shù)據(jù)和標注標簽;將第一交易特征序列數(shù)據(jù)輸入至預設反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡層中,得到第一特征表達;將第一客戶屬性特征數(shù)據(jù)輸入至預設反洗錢模型的全連接神經(jīng)網(wǎng)絡層中,得到第二特征表達;對第一特征表達與第二特征表達進行拼接,得到拼接特征數(shù)據(jù);通過拼接特征數(shù)據(jù)、標注標簽和預設損失函數(shù)對預設反洗錢模型進行迭代訓練,得到訓練好的初始反洗錢模型。本發(fā)明能夠解決現(xiàn)有反洗錢模型訓練的準確性較差的問題。
技術領域
本發(fā)明涉及金融科技(Fintech)技術領域,尤其涉及一種基于RNN的反洗錢模型的訓練方法、裝置、設備及介質。
背景技術
隨著計算機技術的發(fā)展,越來越多的技術應用在金融領域,傳統(tǒng)金融業(yè)正在逐步向金融科技(Fintech)轉變,但由于金融行業(yè)的安全性、實時性要求,也對技術提出了更高的要求。
反洗錢主要是指預防通過各種方式隱瞞、掩飾犯罪所得和收益來源或收益性質的洗錢行為。隨著金融市場逐漸成熟,國家對反洗錢監(jiān)管愈加重視,現(xiàn)有的金融機構均建立反洗錢機制來識別金融交易過程中的反洗錢風險。目前采取的方式通常為:在金融監(jiān)控系統(tǒng)上設置大量的反洗錢模型來識別每筆交易數(shù)據(jù)是否存在一定的洗錢風險,如果存在則進行風險提醒。現(xiàn)有的反洗錢模型的訓練過程,往往依賴于人工整理的特征,并且在整理特征時,只是采用常規(guī)的特征選擇方法如IV(Information Value,信息價值)值篩選方法,以篩選得到用于模型訓練的特征,進而輸入至預設類型的模型中進行訓練。然而,由于金融交易的復雜性,各個特征之間實際上是存在關聯(lián)的,而上述方式無法考慮到各特征之間的聯(lián)系,從而導致模型訓練的準確性較差,進而影響后續(xù)反洗錢客戶檢測結果的準確性。
發(fā)明內容
本發(fā)明的主要目的在于提供一種基于RNN的反洗錢模型的訓練方法、裝置、設備及介質,旨在解決現(xiàn)有反洗錢模型訓練的準確性較差的問題。
為實現(xiàn)上述目的,本發(fā)明提供一種基于RNN的反洗錢模型的訓練方法,所述基于循環(huán)神經(jīng)網(wǎng)絡RNN的反洗錢模型的訓練方法包括:
獲取訓練樣本集,所述訓練樣本集包括樣本客戶的第一交易特征序列數(shù)據(jù)、第一客戶屬性特征數(shù)據(jù)和標注標簽;
將所述第一交易特征序列數(shù)據(jù)輸入至預設反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡層中,得到第一特征表達;
將所述第一客戶屬性特征數(shù)據(jù)輸入至所述預設反洗錢模型的全連接神經(jīng)網(wǎng)絡層中,得到第二特征表達;
對所述第一特征表達與所述第二特征表達進行拼接,得到拼接特征數(shù)據(jù);
通過所述拼接特征數(shù)據(jù)、所述標注標簽和預設損失函數(shù)對所述預設反洗錢模型進行迭代訓練,得到訓練好的初始反洗錢模型。
可選地,所述將所述第一交易特征序列數(shù)據(jù)輸入至預設反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡層中,得到第一特征表達的步驟之前,還包括:
根據(jù)所述第一交易特征序列數(shù)據(jù)獲取各樣本客戶的交易次數(shù);
根據(jù)所述各樣本客戶的交易次數(shù)檢測是否存在交易次數(shù)大于預設次數(shù)的樣本客戶;
若存在,則根據(jù)檢測結果對所述第一交易特征序列數(shù)據(jù)和所述第一客戶屬性特征數(shù)據(jù)進行數(shù)據(jù)增強處理;
所述將所述第一交易特征序列數(shù)據(jù)輸入至預設反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡層中,得到第一特征表達的步驟包括:
將經(jīng)數(shù)據(jù)增強處理的第一交易特征序列數(shù)據(jù)輸入至預設反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡層中,得到第一特征表達;
所述將所述第一客戶屬性特征數(shù)據(jù)輸入至所述預設反洗錢模型的全連接神經(jīng)網(wǎng)絡層中,得到第二特征表達的步驟包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳前海微眾銀行股份有限公司;香港科技大學,未經(jīng)深圳前海微眾銀行股份有限公司;香港科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010794245.1/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風險分析或養(yǎng)老金
- 用于文本到語音的超結構循環(huán)神經(jīng)網(wǎng)絡
- 基于先進的遞歸神經(jīng)網(wǎng)絡的“字母到聲音”
- 一種基于分層循環(huán)神經(jīng)網(wǎng)絡語言模型的語音識別方法
- 模式識別裝置以及模式識別方法
- 音頻事件檢測方法、裝置及計算機可讀存儲介質
- 一種城市交通流量預測方法、系統(tǒng)及電子設備
- 循環(huán)神經(jīng)網(wǎng)絡訓練優(yōu)化方法、設備、系統(tǒng)及可讀存儲介質
- 一種基于RNN的量子計算方法和裝置
- 用于水質參數(shù)預測的聯(lián)合神經(jīng)網(wǎng)絡模型及其訓練方法
- 基于RNN的降噪處理方法及系統(tǒng)





