[發明專利]模型訓練方法、裝置以及計算機可讀存儲介質在審
| 申請號: | 202011448647.2 | 申請日: | 2020-12-09 |
| 公開(公告)號: | CN112529210A | 公開(公告)日: | 2021-03-19 |
| 發明(設計)人: | 劉濟鵬 | 申請(專利權)人: | 廣州云從鼎望科技有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00 |
| 代理公司: | 北京瀚仁知識產權代理事務所(普通合伙) 11482 | 代理人: | 屠曉旭;宋寶庫 |
| 地址: | 511458 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模型 訓練 方法 裝置 以及 計算機 可讀 存儲 介質 | ||
1.一種模型訓練方法,其特征在于,所述方法包括:
對初始訓練集中的無標簽樣本進行噪聲標簽標注,以形成標注訓練集,其中,所述標注訓練集包括所述初始訓練集中的有標簽樣本以及經所述噪聲標簽標注后的樣本;
利用所述標注訓練集對預設的數據處理模型進行訓練,以獲取初始的數據處理模型以及獲取經所述初始的數據處理模型預測到的每個所述無標簽樣本的預測類別;
根據所述預測類別對每一所述無標簽樣本相應的噪聲標簽進行修正,以形成標簽修正后的訓練集;
利用所述標簽修正后的訓練集對所述初始的數據處理模型進行訓練,以獲取最終的數據處理模型。
2.根據權利要求1所述的模型訓練方法,其特征在于,“根據所述預測類別對每一所述無標簽樣本相應的噪聲標簽進行修正”的步驟具體包括:
判斷所述預測類別與所述噪聲標簽表示的類別是否相同;
若相同,則不修正所述噪聲標簽;
若不同,則獲取所述無標簽樣本的特征參數,并根據所述特征參數對所述無標簽樣本進行難易樣本分類,以及根據所述難易樣本分類的結果采用相應的修正方式進行噪聲標簽修正。
3.根據權利要求2所述的模型訓練方法,其特征在于,“獲取所述無標簽樣本的特征參數”的步驟具體包括:
獲取所述預測類別對應的預測概率并且將所述預測概率作為所述無標簽樣本的特征參數;
或者,
獲取所述初始的數據處理模型根據所述無標簽樣本輸出的類別預測向量,其中,所述類別預測向量中的向量元素是所述無標簽樣本分別被預測為每個類別的預測概率;
根據所述每個類別的預測概率并且按照下式所示的方法計算預測向量信息熵,并且將所述預測向量信息熵作為所述無標簽樣本的特征參數:
其中,所述H表示所述預測向量信息熵,所述pi表示所述無標簽樣本被預測為每i個類別的預測概率且i=1,...,n,所述n表示類別總數;
或者,
從所述有標簽樣本中選取每個類別各自對應的代表樣本;
在利用所述標注訓練集對預設的數據處理模型進行訓練時,獲取所述初始的數據處理模型中的特征提取模塊提取到的每個所述代表樣本各自對應的第一特征向量,以及所述無標簽樣本的第二特征向量;
根據所述預測類別對應的代表樣本的第一特征向量以及所述第二特征向量,并且按照下式所示的方法計算所述無標簽樣本與所述預測類別對應的代表樣本之間的平均相似性誤差,以將所述平均相似性誤差作為所述無標簽樣本的特征參數;
其中,所述erri表示當所述預測類別是第i個類別時,所述無標簽樣本與所述第i個類別的代表樣本之間的平均相似性誤差;所述erri_j表示所述無標簽樣本與所述第i個類別對應的第j個代表樣本之間的相似性誤差且j=1,...,m,所述m表示所述第i個類別的代表樣本的總數。
4.根據權利要求3所述的模型訓練方法,其特征在于,“根據所述特征參數對所述無標簽樣本進行難易樣本分類”的步驟具體包括:
當所述特征參數是所述預測類別對應的預測概率時,若所述預測概率大于等于預設的概率閾值,則判定所述無標簽樣本是簡單樣本;否則,判定所述無標簽樣本是難樣本;
或者,
當所述特征參數是所述預測向量信息熵時,若所述預測向量信息熵小于等于預設的信息熵閾值,則判定所述無標簽樣本是簡單樣本;否則,判定所述無標簽樣本是難樣本;
或者,
當所述特征參數是所述平均相似性誤差時,若所述平均相似性誤差小于等于預設的誤差閾值,則判定所述無標簽樣本是簡單樣本;否則,判定所述無標簽樣本是難樣本。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州云從鼎望科技有限公司,未經廣州云從鼎望科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011448647.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種LED日光燈的散熱結構
- 下一篇:一種新型輪滾設備





