[發明專利]一種樣本分類方法、裝置、電子設備及存儲介質有效
| 申請號: | 202010522167.X | 申請日: | 2020-06-10 |
| 公開(公告)號: | CN111652320B | 公開(公告)日: | 2022-08-09 |
| 發明(設計)人: | 張發恩;劉金露 | 申請(專利權)人: | 創新奇智(上海)科技有限公司 |
| 主分類號: | G06V10/774 | 分類號: | G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
| 地址: | 201900 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 樣本 分類 方法 裝置 電子設備 存儲 介質 | ||
本申請提供一種樣本分類方法、裝置、電子設備及存儲介質,用于改善使用目前的方法訓練后的模型進行分類的準確率較低的問題。該方法包括:使用由第一樣本集訓練獲得的特征提取器提取第二樣本集中的訓練樣本的特征,第一樣本集中的樣本數量大于第二樣本集中的樣本數量,第二樣本集包括:測試樣本、訓練標簽和訓練樣本;根據提取的訓練樣本的特征和測試樣本,確定測試樣本對應的初始標簽;使用測試樣本、初始標簽、訓練樣本和訓練標簽訓練特征提取器,獲得訓練后的特征提取器;使用訓練后的特征提取器提取測試樣本的特征;根據測試樣本的特征和測試樣本,確定測試樣本對應的測試標簽。
技術領域
本申請涉及機器學習、模型訓練和圖像分類的技術領域,具體而言,涉及一種樣本分類方法、裝置、電子設備及存儲介質。
背景技術
模型訓練,是指根據訓練數據對目標模型進行訓練,具體的訓練方式根據訓練數據的情況可以包括:監督式學習和無監督學習等方式。監督式學習(Supervisedlearning),又被稱為監督式訓練,是機器學習的一種方法,可以由訓練資料中學到或建立一個學習模式或學習函數,并依此模式推測新的實例。通常訓練數據可以包括訓練集和測試集,使用訓練集對模型進行訓練,獲得訓練后的模型,再使用測試集預測訓練后的模型的準確率。
類原型(Class Prototype),是模型訓練中一個通用的概念,類原型可以理解為在分類任務的過程中模型將樣本分類為該類的基本依據特征;具體例如:若蘋果是一個類別,而梨是另一個類別,將蘋果和梨的各種圖片放入到一個模型中,讓模型學習到每個類的類原型,通常來說一個類別只有一個類原型,蘋果的各種圖片是與蘋果的類原型更相似的,而與梨的類原型不相似,類原型可以理解為這個類別抽象的代表。
在監督式訓練過程中,若訓練集中的某個類別的樣本過少,即訓練集中的該類別只有少量樣本能夠被使用,目前的主要做法是:從訓練集中的該類別少量樣本中學習一個類原型,具體例如:利用訓練集中的該類別的樣本均值作為類原型,然后通過計算待分類樣本與這個類原型的距離來進行分類。在具體的實踐過程中發現,通過使用訓練集中的該類別少量樣本訓練后,再使用樣本均值作為類原型的方法訓練的模型進行分類的準確率較低;也就是說,使用目前的方法訓練后的模型進行分類的準確率較低。
發明內容
本申請實施例的目的在于提供一種樣本分類方法、裝置、電子設備及存儲介質,用于改善使用目前的方法訓練后的模型進行分類的準確率較低的問題。
本申請實施例提供一種樣本分類方法,包括:使用由第一樣本集訓練獲得的特征提取器提取第二樣本集中的訓練樣本的特征,第一樣本集中的樣本數量大于第二樣本集中的樣本數量,第二樣本集包括:測試樣本、訓練標簽和訓練樣本;根據提取的訓練樣本的特征和測試樣本,確定測試樣本對應的初始標簽;使用測試樣本、初始標簽、訓練樣本和訓練標簽訓練特征提取器,獲得訓練后的特征提取器;使用訓練后的特征提取器提取測試樣本的特征;根據測試樣本的特征和測試樣本,確定測試樣本對應的測試標簽。在上述的實現過程中,先根據測試樣本獲得的特征和測試樣本確定初始標簽,使用初始標簽、測試樣本和訓練集訓練特征提取器,即對類原型進行校正的過程,再使用訓練后的特征提取器提取測試樣本的特征;根據測試樣本的特征和測試樣本,確定測試樣本對應的測試標簽;也就是說,將獲得的測試樣本的預測標簽加入訓練數據對特征訓練器重新訓練后,再使用訓練后的特征訓練器對測試樣本進行分類,從而有效地提高了使用模型對測試樣本進行分類的準確率。
可選地,在本申請實施例中,根據提取的訓練樣本的特征和測試樣本,確定測試樣本對應的初始標簽,包括:根據訓練樣本的特征確定初始類原型;根據初始類原型與測試樣本的相似程度,確定測試樣本對應的初始標簽。在上述的實現過程中,通過根據訓練樣本的特征確定初始類原型;根據初始類原型與測試樣本的相似程度,確定測試樣本對應的初始標簽;從而有效地提高了使用模型對測試樣本進行分類的準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于創新奇智(上海)科技有限公司,未經創新奇智(上海)科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010522167.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種五金工件全方位噴漆設備
- 下一篇:一種食品包裝袋的開袋裝置





