[發明專利]一種分類模型訓練方法及裝置、存儲介質在審
| 申請號: | 202010048889.6 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111275089A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 徐澤宇;鄧雄文 | 申請(專利權)人: | 北京松果電子有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 康艷青 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分類 模型 訓練 方法 裝置 存儲 介質 | ||
本公開是關于一種分類模型訓練方法及裝置、存儲介質。分類模型訓練方法,包括:利用已知離散標簽的第一數據集進行分類模型的初始訓練,得到第一分類模型;將第一數據集內的樣本數據輸入到第一分類模型,得到連續標簽;利用樣本數據和連續標簽構成的第二數據集,繼續訓練第一分類模型得到第二分類模型;利用第二分類模型對第一數據集包含的樣本數據進行分類,得到第二分類模型輸出的連續標簽;將第二分類模型輸出的連續標簽滿足存疑條件的樣本數據輸出,以獲得對樣本數據重新標注的離散標簽,以更新第二數據集;利用更新后的第二數據集繼續訓練第二分類模型,直到滿足訓練停止條件。
技術領域
本公開涉及信息技術領域,尤其涉及一種分類模型訓練方法及裝置、存儲介質。
背景技術
神經網絡等可以構成分類模型。分類模型可以用于對圖像和文本進行分類。但是這種分類模型在使用之前,需要使用標注好的樣本數據進行標注。且由于分類模型訓練涉及大量樣本數據的標注,具有標注工作量大,且若標注工作量大伴隨有標注錯誤時,可能會導致訓練得到的分類模型的精確度差的現象。
發明內容
本公開提供一種分類模型訓練方法及裝置、存儲介質。
本公開實施例第一方面提供一種分類模型訓練方法,包括:
利用已知離散標簽的第一數據集進行分類模型的初始訓練,得到第一分類模型;其中,所述離散標簽,用于指示所述第一數據集內樣本數據的類別;
將所述第一數據集內的樣本數據輸入到所述第一分類模型,得到連續標簽,其中,所述連續標簽,用于指示所述樣本數據為對應類別的概率;
利用所述樣本數據和所述連續標簽構成的第二數據集,繼續訓練所述第一分類模型得到第二分類模型;
利用所述第二分類模型對所述第一數據集包含的樣本數據進行分類,得到所述第二分類模型輸出的連續標簽;
將所述第二分類模型輸出的連續標簽滿足存疑條件的所述樣本數據輸出,以獲得對所述樣本數據重新標注的離散標簽,以更新所述第二數據集;
利用更新后的所述第二數據集繼續訓練所述第二分類模型,直到滿足訓練停止條件。
基于上述方案,所述方法還包括:
獲取未知標簽的第三數據集;
所述利用所述第二分類模型對所述第一數據集包含的樣本數據進行分類,得到所述第二分類模型輸出的連續標簽,包括:
利用所述第二分類模型對所述第一數據集與所述第三數據集包含的樣本數據進行分類,得到所述第二分類模型輸出的連續標簽。
基于上述方案,所述將所述第二分類模型輸出的連續標簽滿足存疑條件的所述樣本數據輸出,包括:
將所述第二分類模型輸出的連續標簽位于存疑標簽值區域的所述樣本數據輸出。
基于上述方案,所述將所述第一數據集內的樣本數據輸入到經過初始訓練的所述第一分類模型,得到連續標簽,包括:
將所述第一數據集內的樣本數據輸入到經過初始訓練的所述第一分類模型,得到所述第一分類模型輸出的預測標簽;
根據所述離散標簽和所述預測標簽,得到所述連續標簽。
基于上述方案,所述根據所述離散標簽和所述預測標簽,得到所述連續標簽,包括:
當所述離散標簽為:y1=1且y0=0時,按照如下得到所述連續標簽;
當所述離散標簽為y0=1且y1=0時,按照如下公式得到所述連續標簽;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京松果電子有限公司,未經北京松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010048889.6/2.html,轉載請聲明來源鉆瓜專利網。





