[發明專利]支持多任務和跨任務的小樣本分類訓練方法及裝置在審
| 申請號: | 202011133629.5 | 申請日: | 2020-10-21 |
| 公開(公告)號: | CN112200262A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 黃美玉;向雪霜;徐遙 | 申請(專利權)人: | 中國空間技術研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京善任知識產權代理有限公司 11650 | 代理人: | 張振偉 |
| 地址: | 100094 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 支持 任務 樣本 分類 訓練 方法 裝置 | ||
1.一種支持多任務和跨任務的小樣本分類訓練方法,其特征在于,所述方法包括:
將小樣本分類問題中的分類任務轉換為標準分類問題中的樣本,并將小樣本分類的目標形式轉換為給定大量任務樣本的情況下學習的任務解決器;
模擬標準分類問題中的批訓練處理方式,每次迭代處理每個類別中的一些樣本,采用多任務的小樣本分類訓練算法,每次迭代處理多個任務類別中的一些任務樣本;
模擬標準分類問題中的預訓練處理方式,在大規模數據上為類似小規模數據任務預先訓練基本模型,采用跨任務的小樣本分類訓練算法,在多類別問題上為小類別問題預先訓練基本模型,并利用預先訓練基本模型對小類別問題進行微調。
2.根據權利要求1所述的方法,其特征在于,所述將小樣本分類的目標形式轉換為給定大量任務樣本的情況下學習的任務解決器,包括:
對于標記訓練數據集上的監督學習問題,該問題具有如下的目標函數:
其中,fθ是具有參數集θ的特定網絡,l是給定的損失函數;
對于定義在具有M個類別、每個類別具有H個樣本的訓練集上的標準分類問題,其中是D維的輸入向量,yi∈{1,2,…,M}是類別標號,Dj代表集合D中所有yi=j的樣本(xi,yi)集合,fθ是需要學習的分類器,通用的損失函數l(fθ;xi,yi)是交叉熵,如下式(2)所示:
其中fθ(xi)j代表fθ(xi)的第j個輸出;
考慮在所述訓練集D上的K-way S-shot學習問題,定義任務類別為包含M個類別中的K個索引的類別子空間V∈T,將每個任務類別V中的任務樣本G(V):={(τi,yi)}定義為支撐集SV和對應的查詢集QV中查詢樣本(xi,yi)的組合;假定RANDOMSAMPLE(C,N)表示從集合C中無放回地隨機均勻采樣N個樣本,則V=RANDOMSAMPLE({1,…,M},K),每個任務樣本(τi,yi)被表示成(τi={SV,xi},yi),其中(xi,yi)=RANDOMSAMPLE(QV,1),
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
l(fθ;τi,yi)為原型網絡的損失函數時,則有:
l(fθ;τi,yi)=l(fθ;SV,xi,yi)=-log pθ(y=yi|SV,xi)(5)
其中,d:為距離函數;在給定τi={SV,xi}的情況下,式(5)表示的損失函數與式(2)表示的標準分類問題中的交叉熵損失相對應。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國空間技術研究院,未經中國空間技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011133629.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種明膠的改性方法
- 下一篇:一種加工雜糧的蒸汽膨化設備





