[發(fā)明專利]基于RNN的反洗錢模型的訓練方法、裝置、設(shè)備及介質(zhì)在審
| 申請?zhí)枺?/td> | 202010794245.1 | 申請日: | 2020-08-07 |
| 公開(公告)號: | CN111915437A | 公開(公告)日: | 2020-11-10 |
| 發(fā)明(設(shè)計)人: | 蘭沖;郭天佑;汪亞男;肖和兵;李元;夏爾科 | 申請(專利權(quán))人: | 深圳前海微眾銀行股份有限公司;香港科技大學 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市世紀恒程知識產(chǎn)權(quán)代理事務(wù)所 44287 | 代理人: | 晏波 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 rnn 洗錢 模型 訓練 方法 裝置 設(shè)備 介質(zhì) | ||
1.一種基于RNN的反洗錢模型的訓練方法,其特征在于,所述基于循環(huán)神經(jīng)網(wǎng)絡(luò)RNN的反洗錢模型的訓練方法包括:
獲取訓練樣本集,所述訓練樣本集包括樣本客戶的第一交易特征序列數(shù)據(jù)、第一客戶屬性特征數(shù)據(jù)和標注標簽;
將所述第一交易特征序列數(shù)據(jù)輸入至預設(shè)反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡(luò)層中,得到第一特征表達;
將所述第一客戶屬性特征數(shù)據(jù)輸入至所述預設(shè)反洗錢模型的全連接神經(jīng)網(wǎng)絡(luò)層中,得到第二特征表達;
對所述第一特征表達與所述第二特征表達進行拼接,得到拼接特征數(shù)據(jù);
通過所述拼接特征數(shù)據(jù)、所述標注標簽和預設(shè)損失函數(shù)對所述預設(shè)反洗錢模型進行迭代訓練,得到訓練好的初始反洗錢模型。
2.如權(quán)利要求1所述的基于RNN的反洗錢模型的訓練方法,其特征在于,所述將所述第一交易特征序列數(shù)據(jù)輸入至預設(shè)反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡(luò)層中,得到第一特征表達的步驟之前,還包括:
根據(jù)所述第一交易特征序列數(shù)據(jù)獲取各樣本客戶的交易次數(shù);
根據(jù)所述各樣本客戶的交易次數(shù)檢測是否存在交易次數(shù)大于預設(shè)次數(shù)的樣本客戶;
若存在,則根據(jù)檢測結(jié)果對所述第一交易特征序列數(shù)據(jù)和所述第一客戶屬性特征數(shù)據(jù)進行數(shù)據(jù)增強處理;
所述將所述第一交易特征序列數(shù)據(jù)輸入至預設(shè)反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡(luò)層中,得到第一特征表達的步驟包括:
將經(jīng)數(shù)據(jù)增強處理的第一交易特征序列數(shù)據(jù)輸入至預設(shè)反洗錢模型的循環(huán)神經(jīng)網(wǎng)絡(luò)層中,得到第一特征表達;
所述將所述第一客戶屬性特征數(shù)據(jù)輸入至所述預設(shè)反洗錢模型的全連接神經(jīng)網(wǎng)絡(luò)層中,得到第二特征表達的步驟包括:
將經(jīng)數(shù)據(jù)增強處理的第一客戶屬性特征數(shù)據(jù)輸入至所述預設(shè)反洗錢模型的全連接神經(jīng)網(wǎng)絡(luò)層中,得到第二特征表達。
3.如權(quán)利要求2所述的基于RNN的反洗錢模型的訓練方法,其特征在于,所述根據(jù)檢測結(jié)果對所述第一交易特征序列數(shù)據(jù)和所述第一客戶屬性特征數(shù)據(jù)進行數(shù)據(jù)增強處理的步驟包括:
根據(jù)檢測結(jié)果獲取目標正例樣本客戶和目標負例樣本客戶,并獲取所述目標正例樣本客戶的第二交易特征序列數(shù)據(jù)和第二客戶屬性特征數(shù)據(jù)、及所述目標負例樣本客戶的第三交易特征序列數(shù)據(jù)和第三客戶屬性特征數(shù)據(jù);
根據(jù)預設(shè)采樣次數(shù)公式和第一預設(shè)平衡參數(shù)確定所述目標正例樣本客戶的第一采樣次數(shù),并根據(jù)所述預設(shè)采樣次數(shù)公式和第二預設(shè)平衡參數(shù)確定所述目標負例樣本客戶的第二采樣次數(shù);
根據(jù)所述第一采樣次數(shù)對所述第二交易特征序列數(shù)據(jù)進行采樣,根據(jù)第一采樣結(jié)果對所述第二交易特征序列數(shù)據(jù)進行擴充,得到第四交易特征序列數(shù)據(jù),并根據(jù)所述第一采樣結(jié)果對所述第二客戶屬性特征數(shù)據(jù)進行擴充,得到第四客戶屬性特征數(shù)據(jù);
根據(jù)所述第二采樣次數(shù)對所述第三交易特征序列數(shù)據(jù)進行采樣,根據(jù)第二采樣結(jié)果對所述第三交易特征序列數(shù)據(jù)進行擴充,得到第五交易特征序列數(shù)據(jù),并根據(jù)所述第二采樣結(jié)果對所述第三客戶屬性特征數(shù)據(jù)進行擴充,得到第五客戶屬性特征數(shù)據(jù);
根據(jù)所述第四交易特征序列數(shù)據(jù)和所述第五交易特征序列數(shù)據(jù)確定最大交易次數(shù);
根據(jù)所述最大交易次數(shù)對所述第四交易特征序列數(shù)據(jù)、所述第五交易特征序列數(shù)據(jù)、及除所述目標正例樣本客戶和所述目標負例樣本客戶之外的樣本客戶的交易特征序列數(shù)據(jù)進行填充處理,并根據(jù)填充處理結(jié)果得到經(jīng)數(shù)據(jù)增強處理的第一交易特征序列數(shù)據(jù);
根據(jù)所述第四客戶屬性特征數(shù)據(jù)、所述第五客戶屬性特征數(shù)據(jù)和所述第一客戶屬性特征數(shù)據(jù),得到經(jīng)數(shù)據(jù)增強處理的第一客戶屬性特征數(shù)據(jù)。
4.如權(quán)利要求2所述的基于RNN的反洗錢模型的訓練方法,其特征在于,所述基于RNN的反洗錢模型的訓練方法還包括:
在經(jīng)過數(shù)據(jù)增強處理后,獲取當前訓練樣本集中正例樣本客戶的比例;
根據(jù)所述比例調(diào)整所述預設(shè)損失函數(shù)的權(quán)重系數(shù);
所述通過所述拼接特征數(shù)據(jù)、所述標注標簽和預設(shè)損失函數(shù)對所述預設(shè)反洗錢模型進行迭代訓練,得到訓練好的初始反洗錢模型的步驟包括:
通過所述拼接特征數(shù)據(jù)、所述標注標簽和調(diào)整權(quán)重系數(shù)后的預設(shè)損失函數(shù)對所述預設(shè)反洗錢模型進行迭代訓練,得到訓練好的初始反洗錢模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳前海微眾銀行股份有限公司;香港科技大學,未經(jīng)深圳前海微眾銀行股份有限公司;香港科技大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010794245.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險;稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險,例如,風險分析或養(yǎng)老金
- 用于文本到語音的超結(jié)構(gòu)循環(huán)神經(jīng)網(wǎng)絡(luò)
- 基于先進的遞歸神經(jīng)網(wǎng)絡(luò)的“字母到聲音”
- 一種基于分層循環(huán)神經(jīng)網(wǎng)絡(luò)語言模型的語音識別方法
- 模式識別裝置以及模式識別方法
- 音頻事件檢測方法、裝置及計算機可讀存儲介質(zhì)
- 一種城市交通流量預測方法、系統(tǒng)及電子設(shè)備
- 循環(huán)神經(jīng)網(wǎng)絡(luò)訓練優(yōu)化方法、設(shè)備、系統(tǒng)及可讀存儲介質(zhì)
- 一種基于RNN的量子計算方法和裝置
- 用于水質(zhì)參數(shù)預測的聯(lián)合神經(jīng)網(wǎng)絡(luò)模型及其訓練方法
- 基于RNN的降噪處理方法及系統(tǒng)





