[發明專利]基于隱空間編碼的零樣本學習分類方法在審
| 申請號: | 201711064082.6 | 申請日: | 2017-11-02 |
| 公開(公告)號: | CN107944468A | 公開(公告)日: | 2018-04-20 |
| 發明(設計)人: | 于云龍;冀中 | 申請(專利權)人: | 天津大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 天津市北洋有限責任專利代理事務所12201 | 代理人: | 劉國威 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 空間 編碼 樣本 學習 分類 方法 | ||
1.一種基于隱空間編碼的零樣本學習分類方法,其特征是,對于任一模態,利用矩陣分解的方法將此模態的輸入特征矩陣分解為一個隱層碼矩陣和一個編碼矩陣,并利用隱層碼矩陣和一個解碼矩陣重構原始的輸入特征矩陣,其中編碼矩陣和解碼矩陣是互為轉置的關系,利用矩陣分解的方法學習一個編碼矩陣來表征不同模態特征之間共有的語義信息,得到不同模態之間的語義關聯,進而實現不同模態樣本的分類。
2.如權利要求1所述的基于隱空間編碼的零樣本學習分類方法,其特征是,直接利用矩陣分解的方法將視覺特征矩陣分解為編碼矩陣和線性解碼矩陣即:X~DC,其中p為視覺空間的維度,d為編碼矩陣的維度,n為訓練樣本的個數,具體過程為:
其中|| ||F表示矩陣的弗羅貝尼烏斯范數,λ表示平衡參數,給定編碼矩陣C,最優的解碼矩陣D通過求解以下目標函數獲得:
CTCD+λDXTX=(1+λ)CTX(2)
編碼矩陣C是不相關的,即:
CTC=I(3)
其中I表示單位矩陣,將(3)代入(2)中,得到解碼矩陣D的閉式表達式:
D=(1+λ)CTX(I+λDXTX)-1(4)
將(4)代入(1)中,目標函數(1)表達為:
min Tr[XTX+λCTC]-(1+λ)Tr[CTX(I+λXTX)-1XTC](5)
其中Tr表示矩陣的跡;
考慮到Tr[XTX+λCTC]是常數,因此目標函數(5)等價于:
max Tr[CTX(I+λXTX)-1XTC]
s.t.CTC=I(6)
學習一種線性或者非線性的關系使得語義特征和編碼特征之間的相關性最大,其目標函數為:
其中W表示線性映射矩陣,考慮到CTC=I,因此目標函數轉換為:
max ATWC s.t.ATWWTA=I(8)
固定編碼矩陣C,線性映射矩陣W的最優值為:
將(9)代入到(7)中,目標函數轉換為:
其中△=A(ATA)-1AT,因此步驟2)的目標函數等價為:
max Tr(CT△C)s.t.CTC=I(11)
結合步驟1)和步驟2)的目標函數,目標函數為:
s.t.CTC=I(12)
其中α表示平衡參數,△=A(ATA)-1AT。
3.如權利要求1所述的基于隱空間編碼的零樣本學習分類方法,其特征是,目標函數(12)的優化通過以下方法進行求解:
對于編碼矩陣C的每一列向量C·,i通過求解以下子問題獲得:
利用拉格朗日乘子法,最優C·,i需要滿足下面的優化條件:
(X(I+λXTX)-1XT+α△)C·,i=ωiC·,i(14)
其中ωi表示拉格朗日乘子,因此,編碼矩陣C的優化轉換為特征值分解問題,(X(I+λXTX)-1XT+α△)的前d個最大特征值對應著編碼矩陣C的最優解;
獲得編碼矩陣C的最優解后,解碼矩陣D可以通過公式(4)獲得;同樣的,映射矩陣W可以通過公式(9)獲得。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711064082.6/1.html,轉載請聲明來源鉆瓜專利網。





