[發(fā)明專利]分類模型的訓練方法及計算機可讀存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202210069084.9 | 申請日: | 2022-01-21 |
| 公開(公告)號: | CN114118301A | 公開(公告)日: | 2022-03-01 |
| 發(fā)明(設計)人: | 劉國清;楊廣;王啟程;鄭偉;劉德富;楊國武 | 申請(專利權)人: | 深圳佑駕創(chuàng)新科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08 |
| 代理公司: | 深圳市倡創(chuàng)專利代理事務所(普通合伙) 44660 | 代理人: | 羅明玉 |
| 地址: | 518049 廣東省深圳市福田區(qū)梅林街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 分類 模型 訓練 方法 計算機 可讀 存儲 介質(zhì) | ||
本發(fā)明提供了一種分類模型的訓練方法,包括:根據(jù)第一數(shù)據(jù)集訓練第一分類模型以得到預測分類模型,其中,第一數(shù)據(jù)集為有標簽數(shù)據(jù)的集合;將第二數(shù)據(jù)集輸入預測分類模型進行計算以得到預測標簽,其中,第二數(shù)據(jù)集為無標簽數(shù)據(jù)的集合;根據(jù)第一數(shù)據(jù)集和帶有預測標簽的第二數(shù)據(jù)集依次循環(huán)對第二分類模型進行訓練,并更新第二分類模型的參數(shù)以得到中間分類模型,直至中間分類模型滿足預設條件;以及當中間分類模型滿足預設條件時,將滿足預設條件的中間分類模型作為目標分類模型。此外,本發(fā)明還提供了一種計算機可讀存儲介質(zhì)。本發(fā)明技術方案有效解決了有標簽數(shù)據(jù)的數(shù)量少導致分類模型準確度不高的問題。
技術領域
本發(fā)明涉及機器學習技術領域,尤其涉及一種分類模型的訓練方法及計算機可讀存儲介質(zhì)。
背景技術
深度學習模型在各個領域中已經(jīng)取得了巨大的成就,特別是有監(jiān)督學習算法在各種視覺任務中取得了巨大成功。深度學習一般是從大量已標注的訓練樣本中學習一個模型用于給未見過的樣本預測一個盡可能正確的標簽。然而在許多實際應用場景中,人工標注大規(guī)模的訓練樣本需要耗費巨大的人力和物力。因此,許多研究聚焦于半監(jiān)督學習,即在只有部分已標注樣本和大量未標注樣本的情況下學習的一個模型。
發(fā)明內(nèi)容
本發(fā)明提供了一種分類模型的訓練方法及計算機可讀存儲介質(zhì),用于解決有標簽數(shù)據(jù)的數(shù)量少導致分類模型準確度不高的問題。
第一方面,本發(fā)明實施例提供一種分類模型的訓練方法,所述分類模型的訓練方法包括:
根據(jù)第一數(shù)據(jù)集訓練第一分類模型以得到預測分類模型,其中,所述第一數(shù)據(jù)集為有標簽數(shù)據(jù)的集合;
將第二數(shù)據(jù)集輸入所述預測分類模型進行計算以得到預測標簽,其中,所述第二數(shù)據(jù)集為無標簽數(shù)據(jù)的集合;
將所述第一數(shù)據(jù)集和帶有預測標簽的第二數(shù)據(jù)集兩者之一輸入第二分類模型中訓練,并更新所述第二分類模型的參數(shù)以得到中間分類模型,將兩者之另一輸入所述中間分類模型中訓練,并更新所述中間分類模型的參數(shù);
判斷所述中間分類模型是否滿足預設條件;
當所述中間分類模型沒有滿足預設條件時,將所述第一數(shù)據(jù)集和帶有預測標簽的第二數(shù)據(jù)集兩者之一輸入所述中間分類模型中訓練,并更新所述中間分類模型的參數(shù),將兩者之另一輸入所述中間分類模型中訓練,并更新所述中間分類模型的參數(shù),直至所述中間分類模型滿足預設條件;以及
當所述中間分類模型滿足預設條件時,將滿足預設條件的中間分類模型作為目標分類模型。
第二方面,本發(fā)明實施例提供一種計算機可讀存儲介質(zhì),其特征在于,所述計算機可讀存儲介質(zhì)用于存儲程序指令,所述程序指令可被處理器執(zhí)行以實現(xiàn)如上所述的分類模型的訓練方法。
上述分類模型的訓練方法及計算機可讀存儲介質(zhì),根據(jù)有標簽的第一數(shù)據(jù)訓練第一分類模型以得到預測分類模型,利用預測分類模型為無標簽的第二數(shù)據(jù)計算預測標簽。根據(jù)第一數(shù)據(jù)集和帶有預測標簽的第二數(shù)據(jù)集兩者之一訓練第二分類模型以得到中間分類模型,再根據(jù)兩者之另一訓練中間分類模型,并按順序?qū)χ虚g分類模型進行循環(huán)訓練,直至中間分類模型滿足預設條件,得到目標分類模型。利用預測分類模型為無標簽的第二數(shù)據(jù)計算預測標簽,根據(jù)第一數(shù)據(jù)集和帶有預測標簽的第二數(shù)據(jù)集對第二分類模型進行訓練,極大增加了有標簽的數(shù)據(jù)的數(shù)量,從而得到具有良好分類能力的目標分類模型,提高了目標分類模型的性能。
附圖說明
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖示出的結(jié)構獲得其他的附圖。
圖1為本發(fā)明第一實施例提供的分類模型的訓練方法的流程圖。
圖2為本發(fā)明第一實施例提供的分類模型的訓練方法的第一子流程圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳佑駕創(chuàng)新科技有限公司,未經(jīng)深圳佑駕創(chuàng)新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210069084.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





