[發(fā)明專利]一種保持圖像分類稀疏結(jié)構(gòu)的遷移分類學(xué)習(xí)方法有效
| 申請?zhí)枺?/td> | 201711143495.3 | 申請日: | 2017-11-17 |
| 公開(公告)號: | CN107895177B | 公開(公告)日: | 2021-08-03 |
| 發(fā)明(設(shè)計)人: | 趙丹;汪云云 | 申請(專利權(quán))人: | 南京郵電大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 南京經(jīng)緯專利商標(biāo)代理有限公司 32200 | 代理人: | 劉傳玉 |
| 地址: | 210046 江*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 保持 圖像 分類 稀疏 結(jié)構(gòu) 遷移 學(xué)習(xí)方法 | ||
本發(fā)明公開了一種保持圖像分類稀疏結(jié)構(gòu)的遷移分類學(xué)習(xí)方法,找到兩個分布相近但不同的源域和目標(biāo)域,源域包含有標(biāo)簽數(shù)據(jù),首先在源域上利用監(jiān)督分類方法訓(xùn)練分類器,并利用該分類器預(yù)測目標(biāo)域數(shù)據(jù)的偽標(biāo)簽;其次,利用最大均值差異分別構(gòu)造源域和目標(biāo)域數(shù)據(jù)的邊緣分布和條件分布項(xiàng),將二者組合構(gòu)成聯(lián)合分布項(xiàng);然后,利用有效投影的稀疏學(xué)習(xí)工具包構(gòu)造所有數(shù)據(jù)上的稀疏表示矩陣S以構(gòu)造稀疏結(jié)構(gòu)保持項(xiàng);接著,利用結(jié)構(gòu)風(fēng)險最小化原則構(gòu)造結(jié)構(gòu)風(fēng)險最小化項(xiàng);最后,將結(jié)構(gòu)風(fēng)險最小化項(xiàng)、聯(lián)合分布項(xiàng)以及稀疏結(jié)構(gòu)保持項(xiàng)結(jié)合起來構(gòu)造統(tǒng)一的遷移分類學(xué)習(xí)框架,并利用包含核函數(shù)的分類函數(shù)表示定理代入框架求解獲得最終可用于預(yù)測目標(biāo)域類別的分類器。
技術(shù)領(lǐng)域
本發(fā)明涉及機(jī)器學(xué)習(xí)中遷移學(xué)習(xí)分類技術(shù)領(lǐng)域,尤其涉及一種保持圖像分類稀疏結(jié)構(gòu)的遷移分類學(xué)習(xí)方法。
背景技術(shù)
傳統(tǒng)的機(jī)器學(xué)習(xí)有兩個基本假設(shè),一個是測試樣本和訓(xùn)練樣本應(yīng)該滿足獨(dú)立同分布,其二是需有足夠可利用的訓(xùn)練樣本。但是往往這兩個條件不容易滿足,因此遷移學(xué)習(xí)應(yīng)運(yùn)而出,遷移學(xué)習(xí)是運(yùn)用已經(jīng)知道的內(nèi)容知識對相關(guān)但是不同的領(lǐng)域進(jìn)行求解的方法。運(yùn)用在一個領(lǐng)域已經(jīng)知道的知識,來解決學(xué)習(xí)目標(biāo)領(lǐng)域僅有少量標(biāo)簽樣本甚至于沒有標(biāo)簽樣本的問題。往往兩個領(lǐng)域差異越小,共享的因素越多,遷移學(xué)習(xí)會相對更加容易和精準(zhǔn)。
圖像分類在今天的社會具有極大的潛力,比如人臉分類,場景分類等。場景分類能夠提供非常有效地場景信息,用于指導(dǎo)如行為檢測,目標(biāo)識別之類的機(jī)器視覺任務(wù),如:機(jī)器人要完成抓取辦公桌上水杯的任務(wù),我們可以先進(jìn)行場景類別檢索,找到辦公室場景,再在這個場景中查找水杯。這樣檢索工作會簡單。而提供有效地場景圖片分類方法則是能夠使得機(jī)器人快速響應(yīng)并完成工作的重要之處。因此高效的圖像分類方法可以應(yīng)用在諸多工作中。
稀疏編碼是一種特征表示的方法。稀疏重構(gòu)可以保持?jǐn)?shù)據(jù)的全局信息和幾何結(jié)構(gòu)。稀疏矩陣中絕大多數(shù)元素都為0,稀疏編碼目的是求解少量的能代表低層特征信息基向量的系數(shù),也就是說用其他基向量的線性組合來表示輸入向量。進(jìn)行重新構(gòu)成,假設(shè)X=[x1,x2,……,xn]為一個字典矩陣。其中xi是m維的列向量。稀疏表示的目的是用盡可能少的X中的項(xiàng)去重新表示每一個x。因此對于我們需要的稀疏矩陣S來說。就是要求該矩陣中的非零元素盡可能的少。這是一個l0范數(shù)問題。但是由于l0是一個非確定多項(xiàng)式(NP-hard)的非凸優(yōu)化問題,不好求解。因此稀疏編碼大部分都是采用l 1范數(shù)(求取所有元素的絕對值之和)來解決的。又因?yàn)樵诖蠖鄶?shù)實(shí)際問題中,信號或者圖像x一般是有噪聲的,因此加入容錯率ε。公式如下:
s.t.||xi-Xsi||<ε
1=1Tsi
si為列向量。由si組成的權(quán)重矩陣S可以反映出輸入數(shù)據(jù)的固有幾何特性,判別信息可以自然的保存在權(quán)重矩陣S中。給一個屬于j類別的圖像j=1,……,c,權(quán)重向量si=[0,......,αi,i-1,0,αi,i+1,......,0]T,則理論上(圖像識別中假設(shè)屬于同一類的樣本位于同一個線性子空間)可以被同屬于j類別的其他圖像線性表示表示:
在這里即si中的非零項(xiàng)與j類別中的樣本是有關(guān)聯(lián)的。
結(jié)合結(jié)構(gòu)最小化原則構(gòu)造函數(shù)和熵正則化,期望正則化和流形正則化。可以得到混合正則化的遷移學(xué)習(xí)框架。然后將混合正則化框架作用于源,目標(biāo)域上。最終得到用于目標(biāo)域上的遷移分類器。但是由于使用流形正則化刻畫的是局部的結(jié)構(gòu)信息,這種正則化框架對于圖像的分類效果并不能讓人十分滿意。
發(fā)明內(nèi)容
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于南京郵電大學(xué),未經(jīng)南京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711143495.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





