[發明專利]可疑交易監測模型特征提取方法及裝置在審
| 申請號: | 202011032077.9 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112101950A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 劉鴻斌 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06Q20/40 | 分類號: | G06Q20/40;G06Q40/02;G06K9/62 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊;劉飛 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 可疑 交易 監測 模型 特征 提取 方法 裝置 | ||
本申請提供一種可疑交易監測模型特征提取方法及裝置,所述方法包括:獲取多張基礎數據表及各所述基礎數據表對應的輸入參數;根據所述多張基礎數據表及各所述基礎數據表對應的輸入參數對預先生成的訓練樣本進行自動化特征衍生,得到特征矩陣;對所述特征矩陣進行特征提取。本申請能夠實現不同可疑交易場景下的可疑特征挖掘,為可疑特征監測模型的建立提供基礎。
技術領域
本申請涉及人工智能領域,具體是一種可疑交易監測模型特征提取方法及裝置。
背景技術
為深入實踐風險為本、動態管理的反洗錢工作原則,建立健全的金融機構交易監測標準,需從設計、開發、測試、評估等方面較為系統性地對可疑交易監測模型進行建設。
傳統的可疑交易監測模型開發流程已經無法應對靈活多變的監管需求及層出不窮的新型犯罪手段,且存在如下缺點:現有可疑交易監測模型在構造可疑交易監測模型特征的過程中,基本依靠人工實現設計及新特征的衍生,過程緩慢且艱難,衍生效率極低且構建效果差;可疑交易監測模型特征衍生的過程依賴反洗錢業務專家的領域知識及直覺,人為主觀性大,特征衍生的準確率低。
因此,開發設計一套可疑交易模型自動化特征提取方法,成為金融機構開展反洗錢業務的核心。
發明內容
針對現有技術中的問題,本申請提供一種可疑交易監測模型特征提取方法及裝置,能夠實現不同可疑交易場景下的可疑特征挖掘,為可疑特征監測模型的建立提供基礎。
為解決上述技術問題,本申請提供以下技術方案:
第一方面,本申請提供一種可疑交易監測模型特征提取方法,包括:
獲取多張基礎數據表及各所述基礎數據表對應的輸入參數;
根據所述多張基礎數據表及各所述基礎數據表對應的輸入參數對預先生成的訓練樣本進行自動化特征衍生,得到特征矩陣;
對所述特征矩陣進行特征提取。
進一步地,獲取多張基礎數據表的步驟,包括:
獲取可疑交易監測所應覆蓋的客戶及對應的業務領域;
根據所述客戶及所述業務領域接入對應的上游數據源,生成所述基礎數據表。
進一步地,所述輸入參數包括:分箱結果;獲取所述輸入參數的步驟,包括:
根據所述基礎數據表中各字段的字段類型對各所述基礎數據表中的各字段進行分類;
根據預先設定的k值對分類后的所述基礎數據表中的各多碼值類別型字段進行分箱,得到分箱結果。
進一步地,所述輸入參數包括:特征基元參數;獲取所述輸入參數的步驟,包括:
根據特征衍生數量及可疑交易監測場景選擇特征基元;
根據所述特征基元生成所述特征基元對應的特征基元參數。
進一步地,所述輸入參數包括:字典;獲取所述輸入參數的步驟,包括:
根據所述基礎數據表中各字段的字段類型對基礎數據表中的各字段進行分類,并將分類后的各所述字段存儲為四個字典。
進一步地,所述根據所述多張基礎數據表及各所述基礎數據表對應的輸入參數對預先生成的訓練樣本進行自動化特征衍生,得到特征矩陣,包括:
根據所述多張基礎數據表生成所述訓練樣本;所述訓練樣本包括正樣本數據、負樣本數據及特殊負樣本數據;
根據所述訓練樣本、各所述基礎數據表對應的輸入參數及特征衍生深度進行自動化特征衍生,得到所述特征矩陣。
進一步地,所述對所述特征矩陣進行特征提取,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011032077.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種金融產品估值的在線驗證方法及系統
- 下一篇:一種軌跡確定方法、裝置和設備





