[發明專利]一種基于多模型融合的交易流水處理方法及系統在審
| 申請號: | 202011567495.8 | 申請日: | 2020-12-25 |
| 公開(公告)號: | CN112561530A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 李振;尹正;張剛;鮑東岳;劉昊霖;傅佳美;趙希;任鵬飛;李千惠;黑小波;劉蓓 | 申請(專利權)人: | 民生科技有限責任公司 |
| 主分類號: | G06Q20/38 | 分類號: | G06Q20/38;G06F16/2457;G06F40/289;G06N3/08;G06N3/04 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 巴曉艷 |
| 地址: | 101300 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 模型 融合 交易 流水 處理 方法 系統 | ||
1.一種基于多模型融合的交易流水處理方法,其特征在于,所述方法包括以下步驟:
S1:收集交易流水樣本構建訓練集,所述樣本包括交易流水數據以及與交易流水數據對應的一級標簽和二級標簽;
S2:對訓練集進行預處理,得到每個交易流水樣本的輸入向量;
S3:將輸入向量分別代入輕型梯度提升回歸樹模型、支持向量機模型和邏輯回歸模型進行訓練,結合訓練后的三個模型完成待分類交易流水一級標簽的預測;
S4:在所述S3預測的一級標簽的基礎上,利用卷積神經網絡模型完成待分類交易流水二級標簽的預測。
2.根據權利要求1所述的一種基于多模型融合的交易流水處理方法,其特征在于,所述S1中的交易流水數據包括多個字段,所述字段包括名稱、備注、金額、交易時間。
3.根據權利要求2所述的一種基于多模型融合的交易流水處理方法,其特征在于,所述S2具體包括:
S21:去除訓練集交易流水數據中的特殊字符和停用詞;
S22:對交易流水數據的每個字段進行分詞處理;
S23:將分詞后得到的詞語轉化為詞向量;
S24:將每個字段的所有詞向量累加并取平均值得到字段向量;
S25:將每個樣本的字段向量進行拼接,得到每個樣本的輸入向量集合。
4.根據權利要求1所述的一種基于多模型融合的交易流水處理方法,其特征在于,將錯誤預測結果修正后作為新的樣本組成訓練集,重復所述步驟S2~S4,能夠完成模型的優化。
5.根據權利要求1所述的一種基于多模型融合的交易流水處理方法,其特征在于,所述S3具體包括:
S31:將訓練集中的交易流水數據及與交易流水數據對應的一級標簽輸入輕型梯度提升回歸樹模型進行訓練,基于訓練好的輕型梯度提升回歸樹模型預測得到待分類的交易流水數據屬于各個一級標簽的概率PL(j),其中j代表一級標簽的編號;
S32:將訓練集中的交易流水數據及與交易流水數據對應的一級標簽輸入支持向量機模型進行訓練,基于訓練好的支持向量機模型預測得到待分類交易流水屬于各個一級標簽的概率PSVM(j);
S33:將訓練集中的交易流水數據及與交易流水數據對應的一級標簽輸入邏輯回歸模型進行訓練,基于訓練好的邏輯回歸模型預測得到待分類交易流水屬于各個一級標簽的概率PS(j);
S34:計算各個一級標簽的概率平均值Pj=(PL(j)+PSVM(j)+PS(j))/3,選擇概率平均值最大的一級標簽作為待分類交易流水的一級標簽預測結果。
6.根據權利要求1所述的一種基于多模型融合的交易流水處理方法,其特征在于,所述S4具體包括:
S41:按照訓練集中的一級標簽將訓練集劃分為若干個子訓練集;
S42:分別將每個子訓練集所包含的交易流水數據及與交易流水數據對應的二級標簽輸入卷積神經網絡進行訓練,獲得分別與每個一級標簽對應的多個卷積神經網絡模型;
S43:選擇與所述S3輸出的待分類交易流水一級標簽對應的卷積神經網絡模型,完成對待分類交易流水二級標簽的預測。
7.根據權利要求6所述的一種基于多模型融合的交易流水處理方法,其特征在于,所述卷積神經網絡模型包括:
輸入層,用于將交易流水樣本轉化為神經網絡輸入向量;
卷積層,用于提取每個所述神經網絡輸入向量中的文本特征;
池化層,用于從所述文本特征中篩選出重要特征;
全連接層,用于將所述重要特征連接至分類器,得到待分類交易流水屬于各個二級標簽的概率;
預測層,用于將對應最大概率的二級標簽作為預測結果輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于民生科技有限責任公司,未經民生科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011567495.8/1.html,轉載請聲明來源鉆瓜專利網。





