[發明專利]一種分類模型訓練方法及裝置、存儲介質在審
| 申請號: | 202010048889.6 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111275089A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 徐澤宇;鄧雄文 | 申請(專利權)人: | 北京松果電子有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 康艷青 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 分類 模型 訓練 方法 裝置 存儲 介質 | ||
1.一種分類模型訓練方法,其特征在于,包括:
利用已知離散標簽的第一數據集進行分類模型的初始訓練,得到第一分類模型;其中,所述離散標簽,用于指示所述第一數據集內樣本數據的類別;
將所述第一數據集內的樣本數據輸入到所述第一分類模型,得到連續標簽,其中,所述連續標簽,用于指示所述樣本數據為對應類別的概率;
利用所述樣本數據和所述連續標簽構成的第二數據集,繼續訓練所述第一分類模型得到第二分類模型;
利用所述第二分類模型對所述第一數據集包含的樣本數據進行分類,得到所述第二分類模型輸出的連續標簽;
將所述第二分類模型輸出的連續標簽滿足存疑條件的所述樣本數據輸出,以獲得對所述樣本數據重新標注的離散標簽,以更新所述第二數據集;
利用更新后的所述第二數據集繼續訓練所述第二分類模型,直到滿足訓練停止條件。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:
獲取未知標簽的第三數據集;
所述利用所述第二分類模型對所述第一數據集包含的樣本數據進行分類,得到所述第二分類模型輸出的連續標簽,包括:
利用所述第二分類模型對所述第一數據集與所述第三數據集包含的樣本數據進行分類,得到所述第二分類模型輸出的連續標簽。
3.根據權利要求1或2所述的方法,其特征在于,所述將所述第二分類模型輸出的連續標簽滿足存疑條件的所述樣本數據輸出,包括:
將所述第二分類模型輸出的連續標簽位于存疑標簽值區域的所述樣本數據輸出。
4.根據權利要求1或2所述的方法,其特征在于,所述將所述第一數據集內的樣本數據輸入到經過初始訓練的所述第一分類模型,得到連續標簽,包括:
將所述第一數據集內的樣本數據輸入到經過初始訓練的所述第一分類模型,得到所述第一分類模型輸出的預測標簽;
根據所述離散標簽和所述預測標簽,得到所述連續標簽。
5.根據權利要求4所述的方法,其特征在于,所述根據所述離散標簽和所述預測標簽,得到所述連續標簽,包括:
當所述離散標簽為:y1=1且y0=0時,按照如下得到所述連續標簽;
Y0=1-Y1
當所述離散標簽為y0=1且y1=0時,按照如下公式得到所述連續標簽;
Y1=1-Y0
其中,所述y0為所述離散標簽中標注對應樣本數據為第一類別的標簽值;所述y1為所述離散標簽中標注對應樣本數據為第二類別的標簽值;
所述Y0為所述連續標簽中標注對應樣本數據為第一類別的標簽值;所述Y1為所述連續標簽中標注對應樣本數據為第二類別的標簽值;
所述p0為所述預測標簽中標注對應樣本數據為所述第一類別的預測值,所述p1為所述預測標簽中標注對應樣本數據為所述第二類別的預測值;所述k0為將離散標簽中指示對應樣本數據為第一類別的連續化為所述連續標簽的學習率;所述k1為將離散標簽中指示對應樣本數據為第二類別的連續化為所述連續標簽的學習率;
所述λ為預設值。
6.根據權利要求1所述的方法,其特征在于,所述訓練停止條件,包括以下至少之一:
所述第二分類模型輸出的滿足存疑條件的連續標簽數目小于第一閾值;
所述第二分類模型輸出的滿足存疑條件的連續標簽轉換為所述離散標簽之后的誤標率,小于第二閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京松果電子有限公司,未經北京松果電子有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010048889.6/1.html,轉載請聲明來源鉆瓜專利網。





