[發明專利]基于語義引導的少量樣本分類方法有效
| 申請號: | 201910582212.8 | 申請日: | 2019-06-30 |
| 公開(公告)號: | CN110472652B | 公開(公告)日: | 2023-06-09 |
| 發明(設計)人: | 冀中;柴星亮 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/74;G06V10/774;G06V10/40;G06V10/82;G06V20/70;G06N3/0464 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 杜文茹 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 語義 引導 少量 樣本 分類 方法 | ||
一種基于語義引導的少量樣本分類方法,使用卷積神經網絡模塊對所有樣本圖像分別進行特征提取,得到每張樣本圖像的特征向量;將屬于同類別的樣本圖像的特征向量的均值作為該類別的類別原型來表示該類;通過全連接網絡將所有類別原型映射到與對應類別的語義向量相同的維度,計算類別原型與語義向量的歐式距離,將歐式距離作為一個損失函數來引導類別原型和對應的語義向量對齊;將待識別的圖像進行特征提取并將該圖像映射到與語義相同的維度,與所有類別的類別原型映射到與對應的語義相同的維度得到的向量進行比較,對待識別的圖像進行分類。本發明通過利用語義空間對視覺空間進行約束引導,使圖像的特征空間具有一定的語義相關性,結構更加魯棒。
技術領域
本發明涉及一種樣本分類方法。特別是涉及一種用于計算機視覺領域少量樣本圖像分類的基于語義引導的少量樣本分類方法。
背景技術
圖像識別是各種計算機視覺任務中最基本的也是最具價值的研究方向之一,是其他各種圖像處理任務,如目標檢測、語義分割等的基礎,解決這一問題對整個計算機視覺領域的發展具有極其重要的意義。隨著深度學習的發展,圖像識別任務較之以往取得了突破性的進展。雖然現在的各種算法在圖像識別任務中能取得較高的分類準確率,但這些方法需要成百上千萬的數據來支持網絡的訓練,樣本的獲取以及標注成本極高,同時大多數深度網絡需要在高性能GPU上用很長時間訓練,消耗了大量的算力資源,訓練好的網絡模型參數比較大,這對于一些小型的嵌入式設備來說是不可接受的,雖然可以通過云計算等方法將算力消耗放在遠程服務器上,但這種方法對于要求實時性和穩定性的應用來說也是巨大的挑戰,在網絡建設欠發達的地區其應用十分受限制。
針對深度神經網絡目前存在的這些問題,學術界和工業界的研究重點從傳統的深度學習專項通過少量訓練樣本訓練一個收斂速度快、識別準確率高的網絡成為受關注高的方向。
少樣本圖像識別任務在最近取得了很大的進展,但是這些方法研究的重點大多集中在如何找出一種度量方法,導致某些方法的相似性比較大。這些工作不注意塑造同類樣本特征向量之間的相似性,導致分類的效果不能進一步提升。
發明內容
本發明所要解決的技術問題是,提供一種基于語義引導的少量樣本分類方法。
本發明所采用的技術方案是:一種基于語義引導的少量樣本分類方法,包括如下步驟:
1)使用卷積神經網絡模塊對所有樣本圖像分別進行特征提取,得到每張樣本圖像的特征向量;
2)將屬于同類別的所有樣本圖像的特征向量的均值作為該類別的類別原型來表示該類;
3)通過全連接網絡將所有類別原型映射到與對應類別的語義向量相同的維度,然后計算類別原型與語義向量的歐式距離,將所述的歐式距離作為一個損失函數來引導類別原型和對應的語義向量對齊;
4)將待識別的圖像進行特征提取并將該圖像映射到與語義相同的維度,與所有類別的類別原型映射到與對應的語義相同的維度得到的向量進行比較,對待識別的圖像進行分類。
步驟1)中假設樣本圖像為x,用公式表示如下:
feax=f(x)????????????(1)
其中,f表示特征提取器,feax表示樣本圖像x的特征向量。
步驟2)中
設定屬于同類別的樣本圖像x有N張,則該類別原型用公式表示為:
其中,c表示類別,feacxi表示該類別的第i幅樣本圖像的特征向量,proc表示c類別的類別原型。
步驟3)用公式表示為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910582212.8/2.html,轉載請聲明來源鉆瓜專利網。





