[發明專利]銀行可疑交易評估、數據處理方法及裝置在審
| 申請號: | 202011032514.7 | 申請日: | 2020-09-27 |
| 公開(公告)號: | CN112101952A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 張海鋒 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06Q20/40 | 分類號: | G06Q20/40;G06Q40/02;G06K9/62;G06F16/25;G06N20/00 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊;劉飛 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 銀行 可疑 交易 評估 數據處理 方法 裝置 | ||
本發明提供了一種銀行可疑交易評估、數據處理方法及裝置,銀行可疑交易評估數據處理方法,包括:獲取銀行交易相關數據;對銀行交易相關數據進行數據清理、數據轉換及特征工程處理生成交易數據樣本集;對交易數據樣本集進行樣本平衡處理以使交易樣本集中的可疑交易數據和正常交易數據處于同一數量級,生成銀行可疑交易評估數據。本發明解決了專家模型中基于有限樣本集的局限性問題,擺脫了專家模型中專家的領域知識的約束,進而解決了傳統專家模型中較高的人力成本和模型后期的升級改造成本,通過樣本平衡處理,解決了樣本失衡問題,提高了模型的準確率和召回率。通過對特征進行降維處理,提高了模型的學習效率,降低了時間成本。
技術領域
本發明涉及數據處理技術,具體的講是一種銀行可疑交易評估、數據處理方法及裝置。
背景技術
隨著互聯網科技的創新發展,在經濟全球化的背景之下,金錢交易方式變得更加多元化、組織化以及專業化。交易的途徑與方式參差不齊,相關的客戶數據和交易數據散落各處,這給可疑交易的監管帶來更大的挑戰。
在金融領域業務的快速發展下,伴隨而來的是海量數據的高效處理的要求。在此背景下,傳統的規則集模型越發顯現出了不足,需要投入更多的人力成本來支持模型的搭建。為此,金融領域開始引進了人工智能、大數據和機器學習等技術。基于大數據技術,對數據自身的價值進行挖掘分析,同時通過機器學習技術來學得各類魯棒的模型,其中就包括了可疑交易模型。
傳統的可疑交易模型采用基于規則集的專家模型進行匹配篩查,如圖1所示。專家系統的核心在于領域專家對知識或者規則的提取。領域專家基于可疑交易的抽樣樣本集的數據,進行特征提取等數據分析操作,進而提取出有價值的、可識別出可疑交易信息的有效規則集,并通過人機交互界面等方式最終轉換為機器可理解的知識庫或規則集。一旦形成了規則集知識庫,那么就可以將日常產生的交易數據通過人機交互界面錄入并進行規則集知識庫匹配。模型將對輸入的交易數據進行逐條規則的匹配,最終輸入匹配結果。若結果顯示命中可疑模型的規則集,那么該筆交易即被模型判斷為可疑交易。
傳統的基于規則集的專家方法雖然簡單直接,但受限于人力資源,專家在進行規則提煉獲取時,主要采用抽樣模式進行歸納分析,其中必然不可避免的遺漏掉一些可疑交易的特征,從而導致提煉的基于規則集的專家模型存在一定的局限性。同時,金融行業領域眾多,業務寬泛,專家模型往往局限于各自熟知的領域,這將提高對模型的全局把控與后期維護帶來成本的提高,并且一旦專家對模型規則進行改進后,需要投入新的人力成本進行相應模型的重新開發、測試與上線升級等操作,模型的升級成本較高,在時效性上,由于傳統的基于規則集的專家模型主要用于事后周期性批量作業,存在一定的滯后性。
發明內容
為至少解決現有技術中的一個問題,本發明實施例提供了一種銀行可疑交易評估數據處理方法,包括:
獲取銀行交易相關數據;
對所述銀行交易相關數據進行數據清理、數據轉換及特征工程處理生成交易數據樣本集;
對所述的交易數據樣本集進行樣本平衡處理以使交易樣本集中的可疑交易數據和正常交易數據處于同一數量級,生成銀行可疑交易評估數據。
本發明實施例中,所述的銀行交易相關數據包括:銀行可疑交易和銀行正常交易的客戶信息、交易對手信息、交易信息。
本發明實施例中,所述的對所述銀行交易相關數據進行數據清理、數據轉換及特征工程處理生成交易數據樣本集包括:
對所述銀行交易數據中的噪聲數據、缺失字段數據及重復數據進行清理;
將清理后的銀行交易數據按類型轉換處理;
將轉換處理后的數據加載到數據倉庫;
將數據倉庫中的交易數據進行特征工程處理生成可用于機器模型學習訓練的交易數據樣本集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011032514.7/2.html,轉載請聲明來源鉆瓜專利網。





