[發(fā)明專(zhuān)利]基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201510821480.2 | 申請(qǐng)日: | 2015-11-23 |
| 公開(kāi)(公告)號(hào): | CN105426919A | 公開(kāi)(公告)日: | 2016-03-23 |
| 發(fā)明(設(shè)計(jì))人: | 陳霜霜;劉惠義;曾曉勤;孟志偉 | 申請(qǐng)(專(zhuān)利權(quán))人: | 河海大學(xué) |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62;G06K9/46 |
| 代理公司: | 南京縱橫知識(shí)產(chǎn)權(quán)代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 210098 江*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 顯著 指導(dǎo) 監(jiān)督 特征 學(xué)習(xí) 圖像 分類(lèi) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法,屬于機(jī)器學(xué)習(xí)與計(jì)算機(jī)視覺(jué)技術(shù)領(lǐng)域。
背景技術(shù)
隨著多媒體技術(shù)的發(fā)展,圖像分類(lèi)已成為計(jì)算機(jī)視覺(jué)領(lǐng)域研究的重點(diǎn),圖像分類(lèi)是依據(jù)圖像具有的某種屬性而將其劃分到預(yù)先設(shè)定的不同類(lèi)別中,如何將圖像進(jìn)行有效的表達(dá)是提高圖像分類(lèi)準(zhǔn)確率的關(guān)鍵,特征的選擇與提取問(wèn)題是圖像分類(lèi)目前存在的難點(diǎn)問(wèn)題。隨著移動(dòng)互聯(lián)網(wǎng)的迅速發(fā)展,人類(lèi)社會(huì)已進(jìn)入大數(shù)據(jù)時(shí)代。SIFT、HOG等這些傳統(tǒng)的特征學(xué)習(xí)雖能提取圖像的某些特征,在圖像分類(lèi)中也取得了較好的效果,但這種人工設(shè)計(jì)特征方法存在一定的缺陷。而傳統(tǒng)的有監(jiān)督特征學(xué)習(xí)方法,通過(guò)學(xué)習(xí)人工標(biāo)注數(shù)據(jù),在大數(shù)據(jù)時(shí)代下顯得不合時(shí)宜。
發(fā)明內(nèi)容
為解決現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法,將深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)中融入計(jì)算機(jī)視覺(jué)中一些方法與理論,以提高圖像特征的有效表示,從而達(dá)到理想的分類(lèi)結(jié)果。
為了實(shí)現(xiàn)上述目標(biāo),本發(fā)明采用如下的技術(shù)方案:
一種基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法,其特征是,包括如下步驟:
1)顯著性指導(dǎo)的像素點(diǎn)采集:采用顯著性檢測(cè)算法對(duì)圖像像素點(diǎn)進(jìn)行采集,通過(guò)獲取圖像的顯著圖,采集到圖像中具有代表性表示的像素點(diǎn);
2)非監(jiān)督特征學(xué)習(xí):采用稀疏自編碼來(lái)訓(xùn)練代表性的像素點(diǎn),獲取圖像特征;
3)圖像卷積:分別用圖像數(shù)據(jù)集中訓(xùn)練樣本和測(cè)試樣本對(duì)步驟2)中的圖像特征進(jìn)行卷積操作;
4)局部對(duì)比歸一化:對(duì)步驟3)中獲取的訓(xùn)練樣本和測(cè)試樣本的卷積特征進(jìn)行局部減法和除法歸一化;
5)空間金字塔池化:從三個(gè)不同空間尺度對(duì)步驟4)中獲取的卷積圖像特征進(jìn)行平均池化操作;
6)融合中央先驗(yàn):分別計(jì)算圖像數(shù)據(jù)集中訓(xùn)練樣本和測(cè)試樣本的中央先驗(yàn)值,將該值與步驟5)多尺度池化特征分別進(jìn)行融合操作;
7)圖像分類(lèi):用步驟6)中所獲訓(xùn)練樣本的特征值來(lái)訓(xùn)練分類(lèi)器,將步驟6)中所獲訓(xùn)練樣本的特征值輸入已訓(xùn)練的分類(lèi)器中實(shí)現(xiàn)圖像分類(lèi)。
前述的基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法,其特征在于,所述步驟1)具體步驟為:
1.1)采用上下文感知顯著性檢測(cè)算法,計(jì)算圖像數(shù)據(jù)集中訓(xùn)練集的顯著圖,數(shù)據(jù)集中每幅圖像具有相同的分辨率;
1.2)將每幅顯著圖中像素點(diǎn)按照灰度值的大小進(jìn)行降序排列;
1.3)從每幅顯著圖中選取64個(gè)像素點(diǎn),按照像素點(diǎn)灰度值的大小,從頂部5%中選取50個(gè)正像素點(diǎn)以及從底部30%中選取14個(gè)負(fù)像素點(diǎn);
1.4)計(jì)算每幅顯著圖中滿(mǎn)足要求的像素點(diǎn)的坐標(biāo)信息[X,Y],按照此坐標(biāo)找出該顯著圖對(duì)應(yīng)原始RGB圖像中的正負(fù)像素點(diǎn)。將每一個(gè)像素點(diǎn)設(shè)定為一個(gè)樣本,從而獲得非監(jiān)督特征學(xué)習(xí)的樣本集。
前述的基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法,其特征在于,所述步驟2)的具體步驟為:
2.1)選用稀疏自編碼器作為非監(jiān)督特征學(xué)習(xí)工具,設(shè)定網(wǎng)絡(luò)采用的可視層節(jié)點(diǎn)為M,隱藏層節(jié)點(diǎn)為N;
2.2)將所得的正負(fù)像素樣本集作為稀疏自編碼的輸入,通過(guò)非監(jiān)督的學(xué)習(xí)預(yù)訓(xùn)練所述網(wǎng)絡(luò);通過(guò)不斷迭代網(wǎng)絡(luò)輸入層與隱藏層之間的權(quán)重,實(shí)現(xiàn)數(shù)據(jù)特征的學(xué)習(xí)與特征提取,所獲特征記為W,W是N行、M列大小的矩陣。
前述的基于顯著性指導(dǎo)非監(jiān)督特征學(xué)習(xí)的圖像分類(lèi)方法,其特征在于,所述步驟3)中的具體步驟為:
3.1)將W轉(zhuǎn)為8*8卷積核,產(chǎn)生N*3個(gè)卷積核;
3.2)分別獲取圖像數(shù)據(jù)集中訓(xùn)練樣本、測(cè)試樣本中每幅圖像R、G、B三通道值;
3.3)將每幅圖像的三通道值分別與當(dāng)前特征中的3個(gè)卷積核進(jìn)行二維卷積獲取特征值;
3.4)對(duì)獲取的三通道特征值進(jìn)行求和操作,記為x;
3.5)利用LRel激活函數(shù)計(jì)算出x的激活值y;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于河海大學(xué),未經(jīng)河海大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510821480.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 健康指導(dǎo)方法和健康指導(dǎo)系統(tǒng)
- 維護(hù)指導(dǎo)顯示裝置、維護(hù)指導(dǎo)顯示方法和維護(hù)指導(dǎo)顯示程序
- 康復(fù)指導(dǎo)方法與康復(fù)指導(dǎo)系統(tǒng)
- 健身指導(dǎo)系統(tǒng)及健身指導(dǎo)方法
- 騎行姿勢(shì)指導(dǎo)裝置和騎行姿勢(shì)指導(dǎo)系統(tǒng)
- 指導(dǎo)輔助系統(tǒng)、指導(dǎo)輔助方法及指導(dǎo)輔助程序
- 學(xué)生運(yùn)動(dòng)指導(dǎo)系統(tǒng)及指導(dǎo)方法
- 指導(dǎo)信息提示系統(tǒng)、指導(dǎo)信息提示方法、程序和指導(dǎo)信息提示設(shè)備
- 視覺(jué)指導(dǎo)裝置、視覺(jué)指導(dǎo)系統(tǒng)、以及視覺(jué)指導(dǎo)方法
- 一種健身指導(dǎo)系統(tǒng)及其指導(dǎo)方法
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺(jué)訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺(jué)系統(tǒng)的方法
- 一種基于廠(chǎng)區(qū)智能管理系統(tǒng)的工廠(chǎng)設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





