[發明專利]一種分類模型訓練方法及計算機設備在審
| 申請號: | 202011637697.5 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112766320A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 楊德杰 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 肖遙 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分類 模型 訓練 方法 計算機 設備 | ||
1.一種分類模型訓練方法,其特征在于,包括:
從初始樣本集合中挖掘出正樣本集合,以及與所述正樣本集合對應的候選樣本集合;
利用預先構建的生成式對抗網絡,基于所述候選樣本集合與所述正樣本集合輸出補充樣本集合;
利用基于所述補充樣本集合與所述正樣本集合得到的目標樣本集合,對預設分類模型進行訓練,得到訓練后的分類模型。
2.根據權利要求1所述的分類模型訓練方法,其特征在于,所述從初始樣本集合中挖掘出正樣本集合,以及與所述正樣本集合對應的候選樣本集合,包括:
根據預設樣本條件從所述初始樣本集合中確定出正樣本集合與負樣本集合;
從所述負樣本集合中確定出候選樣本集合。
3.根據權利要求2所述的分類模型訓練方法,其特征在于,所述從所述負樣本集合中確定出候選樣本集合,包括:
測算所述負樣本與參考樣本之間的相似度;其中,所述參考樣本為所述正樣本集合中的任一正樣本;
若所述相似度等于或大于預設閾值,則將所述負樣本作為參考樣本,得到參考樣本集合。
4.根據權利要求3所述的分類模型訓練方法,其特征在于,所述測算所述負樣本與參考樣本之間的相似度,包括:
通過以下公式測算得到所述負樣本與參考樣本之間的相似度;
其中,DM(x,y)為所述相似度;x為所述參考樣本中目標維度的第一數據;y為所述負樣本中目標維度的第二數據;T表示裝置;∑-1表示所述第一數據與所述第二數據之間特征向量的協方差矩陣。
5.根據權利要求1所述的分類模型訓練方法,其特征在于,所述生成式對抗網絡包括生成模型與判別模型;
所述利用預先構建的生成式對抗網絡,基于所述候選樣本集合與所述正樣本集合輸出補充樣本集合,包括:
通過所述生成模型根據所述候選樣本集合生成第一樣本集合;
通過判別模型根據所述第一樣本集合與所述正樣本集合輸出補充樣本集合。
6.根據權利要求5所述的分類模型訓練方法,其特征在于,所述補充樣本集合包括正補充樣本與負補充樣本;
所述利用基于所述補充樣本集合與所述正樣本集合得到的目標樣本集合,對預設分類模型進行訓練,得到訓練后的分類模型,包括:
按照預設的樣本配比,從所述補充樣本集合中確定出正補充樣本集合與負補充樣本集合;
將所述正補充樣本集合與所述負補充樣本集合填充至所述正樣本集合中,得到目標樣本集合;
利用所述目標樣本集合對預設分類模型進行訓練,得到訓練后的分類模型。
7.根據權利要求1-6任一項所述的分類模型訓練方法,其特征在于,在所述利用所述補充樣本集合與所述正樣本集合組成的目標樣本集合,對預設分類模型進行訓練,得到訓練后的分類模型的步驟之后,還包括:
將所述訓練后的分類模型部署至區塊鏈節點中。
8.一種分類模型訓練裝置,其特征在于,包括:
挖掘單元,用于從初始樣本集合中挖掘出正樣本集合,以及與所述正樣本集合對應的候選樣本集合;
輸出單元,用于利用預先構建的生成式對抗網絡,基于所述候選樣本集合與所述正樣本集合輸出補充樣本集合;
訓練單元,用于利用基于所述補充樣本集合與所述正樣本集合得到的目標樣本集合,對預設分類模型進行訓練,得到訓練后的分類模型。
9.一種計算機設備,其特征在于,所述計算機設備包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,所述處理器執行所述計算機程序時如權利要求1至7任一項所述方法的步驟。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1至7任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011637697.5/1.html,轉載請聲明來源鉆瓜專利網。





