[發(fā)明專利]一種異常交易識別方法及裝置在審
| 申請?zhí)枺?/td> | 202310239931.6 | 申請日: | 2023-03-06 |
| 公開(公告)號: | CN116228425A | 公開(公告)日: | 2023-06-06 |
| 發(fā)明(設(shè)計(jì))人: | 張寶華 | 申請(專利權(quán))人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06Q40/04 | 分類號: | G06Q40/04;G06F18/2433;G06N3/0464;G06N3/0475;G06N3/094;G06N3/084;G06N3/048 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 王首峰 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 異常 交易 識別 方法 裝置 | ||
本發(fā)明可用于人工智能技術(shù)在金融方面應(yīng)用的技術(shù)領(lǐng)域,本發(fā)明提供了一種異常交易識別方法及裝置,異常交易識別方法包括:接收待識別交易的交易數(shù)據(jù);根據(jù)所述交易數(shù)據(jù)以及預(yù)先生成的異常交易識別模型判斷所述待識別交易是否為異常交易,所述異常交易識別模式是基于對抗學(xué)習(xí)方法以及全連接神經(jīng)網(wǎng)絡(luò)算法所生成的。本發(fā)明可以有效解決金融領(lǐng)域機(jī)器學(xué)習(xí)過程中受噪聲標(biāo)簽、樣本不平衡影響較大的問題。
技術(shù)領(lǐng)域
本申請屬于人工智能技術(shù)領(lǐng)域,具體涉及一種異常交易識別方法及裝置。
背景技術(shù)
在金融機(jī)器學(xué)習(xí)實(shí)際應(yīng)用場景中,標(biāo)注數(shù)據(jù)往往需要大量的人力、物力與財(cái)力,標(biāo)注的數(shù)據(jù)質(zhì)量某種程度上還受到人為主觀因素的影響,導(dǎo)致實(shí)際獲取的標(biāo)注樣本往往含有不定比例的標(biāo)簽被錯誤標(biāo)記,業(yè)界技術(shù)人員將這部分被錯誤標(biāo)記的標(biāo)簽稱為噪聲標(biāo)簽。
現(xiàn)有的人工智能(AI,Artificial?Intelligence)技術(shù)極度依賴標(biāo)注數(shù)據(jù)的數(shù)量和質(zhì)量。標(biāo)注數(shù)據(jù)的數(shù)量、標(biāo)注的準(zhǔn)確性、不同類別訓(xùn)練樣本的均衡性,在訓(xùn)練過程中對模型有重大影響,可能會導(dǎo)致模型向完全錯誤的方向擬合,極大地影響AI技術(shù)的準(zhǔn)確度和落地應(yīng)用的可靠性。
在實(shí)際應(yīng)用場景中,標(biāo)注數(shù)據(jù)往往需要大量的人力成本,對標(biāo)注數(shù)量產(chǎn)生制約。另一方面,標(biāo)注的數(shù)據(jù)質(zhì)量不易把控,實(shí)際獲取的標(biāo)注樣本往往含有一定比例的標(biāo)簽被錯誤標(biāo)記(噪聲標(biāo)簽)。再者存在很多應(yīng)用問題,特別是異常檢測問題,樣本分布極度不均衡,真正的異常樣本只占總樣本非常小的比例。這些問題的存在,導(dǎo)致許多理論上優(yōu)秀的監(jiān)督學(xué)習(xí)模型在實(shí)際應(yīng)用時無法達(dá)到理想的效果。
發(fā)明內(nèi)容
本發(fā)明可用于人工智能技術(shù)在金融方面應(yīng)用的技術(shù)領(lǐng)域,也可用于除金融領(lǐng)域之外的任意領(lǐng)域,本發(fā)明基于金融領(lǐng)域真實(shí)場景數(shù)據(jù)集,有效解決金融領(lǐng)域機(jī)器學(xué)習(xí)過程中受噪聲標(biāo)簽、樣本不平衡影響較大的問題。
為解決本申請背景技術(shù)中的技術(shù)問題,本發(fā)明提供以下技術(shù)方案:
第一方面,本發(fā)明提供一種異常交易識別方法包括:
接收待識別交易的交易數(shù)據(jù);
根據(jù)所述交易數(shù)據(jù)以及預(yù)先生成的異常交易識別模型判斷所述待識別交易是否為異常交易,所述異常交易識別模式是基于對抗學(xué)習(xí)方法以及全連接神經(jīng)網(wǎng)絡(luò)算法所生成的。
一實(shí)施例中,生成異常交易識別模型的方法包括以下步驟:
利用全連接神經(jīng)網(wǎng)絡(luò)算法生成模擬樣本生成模型以及辨別模型,所述模擬樣本生成模型用于生成模擬樣本,所述辨別模型包括多個子辨別模型,所述多個子辨別模型的全連接神經(jīng)網(wǎng)絡(luò)的參數(shù)不同;所述子辨別模型用于辨別輸入樣本是否為所述模擬樣本,以及辨別所述輸入樣本是否為異常交易;
根據(jù)多個子辨別模型、歷史交易數(shù)據(jù)以及所述模擬樣本生成模型對所述辨別模型進(jìn)行訓(xùn)練,直至預(yù)設(shè)的損失函數(shù)收斂,以生成所述異常交易識別模型。
一實(shí)施例中,所述根據(jù)多個子辨別模型、歷史交易數(shù)據(jù)以及所述模擬樣本生成模型對所述辨別模型進(jìn)行訓(xùn)練,包括:
將模擬樣本以及所述歷史交易數(shù)據(jù)中的真實(shí)樣本輸入至多個子辨別模型,以生成每個子辨別模型對應(yīng)的預(yù)測標(biāo)簽;
根據(jù)所有子辨別模型的預(yù)測標(biāo)簽的平均值與每個子辨別模型的預(yù)測標(biāo)簽之間的差值確定所述辨別模型的置信度;
根據(jù)所述預(yù)測標(biāo)簽以及所述置信度對所述辨別模型進(jìn)行反向傳播,直至所述損失函數(shù)收斂。
一實(shí)施例中,所述根據(jù)所述預(yù)測標(biāo)簽以及所述置信度對所述辨別模型進(jìn)行反向傳播,包括:
將歷史交易數(shù)據(jù)中的真實(shí)標(biāo)簽與所述預(yù)測標(biāo)簽進(jìn)行凸組合操作,以生成翻新標(biāo)簽;
根據(jù)所述置信度以及所述翻新標(biāo)簽對所述辨別模型進(jìn)行反向傳播,以訓(xùn)練所述辨別模型。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國工商銀行股份有限公司,未經(jīng)中國工商銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310239931.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類目不包含的專門適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測目的的處理系統(tǒng)或方法
G06Q40-00 金融;保險(xiǎn);稅務(wù)策略;公司或所得稅的處理
G06Q40-02 .銀行業(yè),例如,利息計(jì)算、信貸審批、抵押、家庭銀行或網(wǎng)上銀行
G06Q40-04 .交易,例如,股票、商品、金融衍生工具或貨幣兌換
G06Q40-06 .投資,例如,金融工具、資產(chǎn)組合管理或者基金管理
G06Q40-08 .保險(xiǎn),例如,風(fēng)險(xiǎn)分析或養(yǎng)老金





