[發明專利]模型訓練方法及系統、存儲介質在審
| 申請號: | 202011362884.7 | 申請日: | 2020-11-28 |
| 公開(公告)號: | CN114692886A | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 林科;權濤;繆丹丹 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 熊永強;李稷芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 系統 存儲 介質 | ||
1.一種模型訓練方法,其特征在于,包括:
獲取異構分布半監督數據集;
根據所述異構分布半監督數據集的元特征確定半監督學習算法;
根據所述半監督學習算法和所述異構分布半監督數據集,得到M個模型和所述M個模型分別對應的權重,其中,所述M個模型的精度均大于預設精度,M為不小于1的整數。
2.根據權利要求1所述的方法,其特征在于,所述根據所述異構分布半監督數據集的元特征確定半監督學習算法,包括:
確定所述異構分布半監督數據集的邊距密度;
根據所述異構分布半監督數據集的邊距密度確定半監督學習算法。
3.根據權利要求2所述的方法,其特征在于,還包括:獲取所述異構分布半監督數據集的至少一個統計分析參數;
所述根據所述異構分布半監督數據集的邊距密度確定半監督學習算法,包括:
根據所述至少一個統計分析參數和所述邊距密度確定所述半監督學習算法。
4.根據權利要求2或3所述的方法,其特征在于,所述邊距密度滿足以下條件:
MD=a*∑l0/1(yl,f(xl))+b*∑1/Rdist(f(·),xu);
其中,MD為邊距密度;a、b均不小于0,且a+b=1,l0/1(·)為損失函數;
yl為真實標簽,f(xl)為劃分超平面對有標注樣本xl的分類結果;Rdist(f(·),xu)為距離函數。
5.根據權利要求2或3所述的方法,其特征在于,所述邊距密度滿足以下條件:
ξ為松弛變量,ξi(i=1.2,...,l)對應有標注樣本,ξi(i=l+1,l+2,...,m)對應無標注樣本;c大于0。
6.根據權利要求1所述的方法,其特征在于,所述根據所述半監督學習算法和所述異構分布半監督數據集,得到M個模型和所述M個模型分別對應的權重,包括:
根據所述半監督學習算法和所述異構分布半監督數據集,得到N個候選模型,N為不小于1的整數;
對所述N個候選模型分別進行訓練,得到訓練后的N個候選模型;
分別計算所述訓練后的N個候選模型的精度;
從所述N個候選模型中獲取精度大于所述預設精度的M個模型,其中,N為不小于M的整數;
根據所述M個模型獲取每個模型的最優融合權重,以得到所述M個模型分別對應的權重。
7.根據權利要求6所述的方法,其特征在于,所述獲取每個模型的最優融合權重,包括:
根據所述M個模型分別對所述異構分布半監督數據集中的每個有標注樣本和每個無標注樣本進行預測,得到所述每個有標注樣本和每個無標注樣本分別對應所述M個模型的預測類別概率;
根據所述每個無標注樣本分別對應所述M個模型的預測類別概率得到無標注樣本集合的加權融合信息熵;
根據所述每個有標注樣本分別對應所述M個模型的預測類別概率以及樣本標注信息得到有標注樣本集合的加權融合誤差率;
根據所述無標注樣本集合的加權融合信息熵和所述有標注樣本集合的加權融合誤差率得到最優化目標函數;
根據所述最優化目標函數確定所述M個模型中每個模型的最優融合權重。
8.根據權利要求7所述的方法,其特征在于,還包括根據所述異構分布半監督數據集的元特征確定所述最優化目標函數的約束條件;
所述根據所述最優化目標函數得到所述M個模型中每個模型的最優融合權重,包括:
根據所述最優化目標函數和所述最優化目標函數的約束條件得到所述M個模型中每個模型的最優融合權重。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011362884.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種蓮藕灌米機
- 下一篇:一種五谷飄香豆香糊及其制作方法





