[發明專利]一種模型訓練方法、業務處理方法、裝置及設備在審
| 申請號: | 202011011568.5 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112102049A | 公開(公告)日: | 2020-12-18 |
| 發明(設計)人: | 王怡冰;朱克鵬;王德剛;申中華;張雨;賈飛;金亮;陸亦敏;李陽;魏聰惠;劉洋;薛飛;劉水泉;陳建文 | 申請(專利權)人: | 中國建設銀行股份有限公司 |
| 主分類號: | G06Q30/08 | 分類號: | G06Q30/08 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 賈磊;劉飛 |
| 地址: | 100033 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 模型 訓練 方法 業務 處理 裝置 設備 | ||
本說明書實施例提供一種模型訓練方法、業務處理方法、裝置及設備。所述方法包括:獲取至少一個歷史記載業務;所述歷史記載業務對應有業務信息;根據業務信息確定歷史記載業務對應于至少一個預設判斷規則的判斷結果;所述判斷結果包括正常業務和異常業務;利用判斷結果中包括異常業務的歷史記載業務的業務信息構建至少一個訓練樣本業務;所述訓練樣本業務的數量大于所述異常業務的數量;基于訓練樣本業務訓練異常業務識別模型;所述異常業務識別模型用于識別異常業務。通過上述方法,在獲取到異常業務后對異常業務的數量進行擴充,并利用擴充后的訓練樣本業務對模型進行訓練,從而保證訓練模型時具有充足的樣本量,確保了識別異常業務的準確性。
技術領域
本說明書實施例涉及計算機技術領域,特別涉及一種模型訓練方法、業務處理方法、裝置及設備。
背景技術
隨著人工智能技術的發展,人們可以借助計算機完成一些需要人類的智能才能完成的工作,例如對目標對象進行分類,或進行圖像識別和處理等。而機器學習技術又是人工智能的核心技術,主要通過不斷獲取新的數據來完善對于某一事物的認知,例如當確定用于識別某一對象的模型之后,通過不斷地獲取對應于所述對象的樣本數據,并利用所述樣本數據進行訓練以完善所述模型,進而使得所述模型更為準確地識別該對象。
為了保證機器學習模型的準確性,在訓練機器學習模型時往往需要利用大量的訓練樣本數據。但是,當用于訓練模型的樣本數據量過小時,可能無法訓練出具有較高準確性的模型。例如,當訓練模型對異常投標進行識別時,需要從以往的投標記錄中篩選出異常投標記錄,并利用標記后的數據對相應的模型進行訓練。但是,實際生活中,諸如投標公司互相串通、投標公司預先獲知標底信息等異常投標的情況并不常見,所獲取到的投標記錄中可能只包含有較少的異常投標記錄,而在異常投標記錄較少的情況下,基于異常投標記錄訓練得到的模型可能只能針對一些異常投標的特例進行識別,從而使得模型缺乏一定的準確性。因此,目前亟需一種在訓練樣本較少時仍然能夠實現對機器學習模型的正常訓練的方法。
發明內容
本說明書實施例的目的是提供一種模型訓練方法、業務處理方法、裝置及設備,以解決如何方便準確地利用訓練后的模型對異常業務進行識別的問題。
為解決上述技術問題,本說明書實施例提供一種模型訓練方法,包括:
獲取至少一個歷史記載業務;所述歷史記載業務對應有業務信息;
根據所述業務信息確定所述歷史記載業務對應于至少一個預設判斷規則的判斷結果;所述判斷結果包括正常業務和異常業務;
利用判斷結果中包括異常業務的歷史記載業務的業務信息構建至少一個訓練樣本業務;所述訓練樣本業務的數量大于所述歷史記載業務的數量;
基于所述訓練樣本業務訓練異常業務識別模型;所述異常業務識別模型用于識別異常業務。
本說明書實施例還提出一種模型訓練裝置,包括:
歷史記載業務獲取模塊,用于獲取至少一個歷史記載業務;所述歷史記載業務對應有業務信息;
判斷結果確定模塊,用于根據所述業務信息確定歷史記載業務對應于至少一個預設判斷規則的判斷結果;所述判斷結果包括正常業務和異常業務;
訓練樣本業務構建模塊,用于利用判斷結果中包括異常業務的歷史記載業務的業務信息構建至少一個訓練樣本業務;所述訓練樣本業務的數量大于所述歷史記載業務的數量;
異常業務識別模型訓練模塊,用于基于所述訓練樣本業務訓練異常業務識別模型;所述異常業務識別模型用于識別異常業務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國建設銀行股份有限公司,未經中國建設銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011011568.5/2.html,轉載請聲明來源鉆瓜專利網。





