[發(fā)明專利]一種基于深度學(xué)習(xí)的紋身圖像分類方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410138343.4 | 申請(qǐng)日: | 2014-04-08 |
| 公開(公告)號(hào): | CN103996056B | 公開(公告)日: | 2017-05-24 |
| 發(fā)明(設(shè)計(jì))人: | 張永良;肖健偉;高思斌;肖剛 | 申請(qǐng)(專利權(quán))人: | 浙江工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/66 | 分類號(hào): | G06K9/66 |
| 代理公司: | 杭州斯可睿專利事務(wù)所有限公司33241 | 代理人: | 王利強(qiáng) |
| 地址: | 310014 浙江省*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) 紋身 圖像 分類 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理和模式識(shí)別等技術(shù)領(lǐng)域,尤其是一種紋身圖像分類方法。
背景技術(shù)
紋身圖像識(shí)別的研究剛剛興起,沒查閱到國(guó)內(nèi)相關(guān)的論文和專利,在國(guó)外也只有A.K.Jain等幾個(gè)學(xué)者在從事紋身相關(guān)的學(xué)術(shù)研究。盡管已有了一定的發(fā)展,但仍存在諸多迫切需要解決的問題。第一,現(xiàn)有感興趣區(qū)檢測(cè)方法存在一定的缺陷。現(xiàn)有紋身圖像感興趣區(qū)的檢測(cè),主要是通過人工標(biāo)定或圖像分割算法。圖像分割算法是低層視覺特征對(duì)用戶實(shí)際興趣的一種估計(jì),難以實(shí)現(xiàn)對(duì)感興趣區(qū)的客觀描述。因此,這兩種方法都存在主觀性問題。第二,人工語(yǔ)義標(biāo)注難以適應(yīng)日益變大的圖像數(shù)據(jù)庫(kù)。對(duì)大規(guī)模的圖像數(shù)據(jù)庫(kù)進(jìn)行的人工語(yǔ)義標(biāo)注需要耗費(fèi)大量的人力和時(shí)間,而且人對(duì)圖像的理解是非常主觀的,不同的人依據(jù)自身的知識(shí)、經(jīng)驗(yàn)、情緒和其他情況,可能對(duì)相同的圖像做出不同的理解。第三,低質(zhì)量圖像匹配方法尚待完善。現(xiàn)有的紋身識(shí)別方法,大都通過提取關(guān)鍵點(diǎn)作為比對(duì)特征,當(dāng)圖像對(duì)比度小、亮度不均或者圖像分辨率低的時(shí)候,提取得到的關(guān)鍵點(diǎn)數(shù)少;如果紋身圖像被毛發(fā)遮擋,那么大部分的關(guān)鍵點(diǎn)會(huì)從毛發(fā)而不是從紋身中提取得到。由于紋身是刻在人體皮膚上的,因此紋身圖像會(huì)隨人體的運(yùn)動(dòng)而發(fā)生扭曲和變形。紋身識(shí)別系統(tǒng)的性能往往因?yàn)槲茨芎侠淼挠?jì)算低質(zhì)量紋身圖像間的相似度而明顯下降。
深度學(xué)習(xí)是受大腦是一個(gè)深度網(wǎng)絡(luò)結(jié)構(gòu)的啟發(fā),對(duì)于深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)研究了10多年。但是在2006年前一直沒有好的結(jié)果,只有2,3層的網(wǎng)絡(luò)有比較好的結(jié)果,更加深層的網(wǎng)絡(luò)甚至比淺層網(wǎng)絡(luò)的表現(xiàn)還要差。在2006年可以看做是深度結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)的一種突破,Hinton和他的團(tuán)隊(duì)使用了一種深度置信網(wǎng)絡(luò)(Deep Belief Networks:DBN)。這個(gè)訓(xùn)練方法是使用無(wú)監(jiān)督的方法逐層貪婪地每次訓(xùn)練一層。使用的是RBM(Restricted Boltzmann Machine),之后相關(guān)的基于自編碼機(jī)(Auto-Encoder:AE)被提出。顯然是使用同一種方法:訓(xùn)練中間層時(shí)使用無(wú)監(jiān)督的學(xué)習(xí)方法。這種方法可以用在中間層的每一層,其他的深度結(jié)構(gòu)的算法(不是RBM和AE)也在最近被提出,但是都八九不離十。從2006年后深度網(wǎng)絡(luò)成功運(yùn)用于分類,回歸問題、降維、紋理建模、運(yùn)動(dòng)建模、目標(biāo)分割、信息提取、機(jī)器人領(lǐng)域、自然語(yǔ)言處理、協(xié)同過濾等,盡管AE,RBM,DBN可以被用于訓(xùn)練為標(biāo)定的數(shù)據(jù),在許多上述的運(yùn)用案例當(dāng)中,他們被成功來(lái)用初始化深度受監(jiān)督的前向回饋神經(jīng)網(wǎng)絡(luò)。
神經(jīng)網(wǎng)絡(luò)在處理信息的時(shí)候使用分布式表達(dá):信息不是存儲(chǔ)在單一的幾個(gè)神經(jīng)元上的,而是分開存儲(chǔ)在許多的神經(jīng)元上,不僅信息是被分布式存儲(chǔ)的,大腦處理信息也是稀疏的,同一時(shí)間只有約1~4%的神經(jīng)元被激活。
在許多計(jì)算機(jī)視覺系統(tǒng)中,學(xué)習(xí)算法受限于處理鏈的一些特定的部分,剩下部分的設(shè)計(jì)非常耗時(shí)耗力,這也就是限制這些系統(tǒng)規(guī)模的很大原因。從另外一方面來(lái)說(shuō),終極目標(biāo)的人工智能當(dāng)然不只是為了識(shí)別某些特定的物體。我們需要一個(gè)完整的算法去解決一個(gè)非常多的任務(wù)和感知。這就使人為標(biāo)定這些東西比較困難,所以在這種情況下學(xué)習(xí)無(wú)標(biāo)定樣本的無(wú)監(jiān)督學(xué)習(xí)成為一個(gè)比較重要的事情。這成為多任務(wù)學(xué)習(xí)(multi-task learning)的一個(gè)重要部分,使用多層結(jié)構(gòu)的學(xué)習(xí)算法很自然地提供了這種共享和重用的概念:低等級(jí)的視覺特征(比如邊緣探測(cè)器)和中等級(jí)的視覺特征(比如人的一部分)對(duì)于探測(cè)一個(gè)人是非常有用的,同時(shí)也對(duì)于探測(cè)別的包含人在內(nèi)的大量物體。深度學(xué)習(xí)算法基于中間層的表現(xiàn)可以在不同人物中共享他們的特征,從而他們可以利用無(wú)監(jiān)督的數(shù)據(jù)和一些數(shù)據(jù)來(lái)自相似的任務(wù)來(lái)解決一些由于數(shù)據(jù)標(biāo)定問題而導(dǎo)致不能學(xué)習(xí)的問題。
使用深度學(xué)習(xí)的分類器能帶來(lái)如下好處:
1.分類器具有學(xué)習(xí)復(fù)雜的高度變化的函數(shù)的能力
2.具有學(xué)習(xí)超大樣本量的能力
3.分類器的主要學(xué)習(xí)過程是通過無(wú)標(biāo)定樣本使用無(wú)監(jiān)督學(xué)習(xí)獲得的。
4.具有淺層特征共享的能力
5.有較強(qiáng)的無(wú)監(jiān)督學(xué)習(xí)能力
自編碼神經(jīng)網(wǎng)絡(luò)是一種無(wú)監(jiān)督學(xué)習(xí)算法,它使用了反向傳播算法,并讓目標(biāo)值等于輸入值。自編碼神經(jīng)網(wǎng)絡(luò)嘗試學(xué)習(xí)一個(gè)hW,b(x)≈x的函數(shù)。換句話說(shuō),它嘗試逼近一個(gè)恒等函數(shù),從而使得輸出接近于輸入x。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江工業(yè)大學(xué),未經(jīng)浙江工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410138343.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:用于對(duì)數(shù)據(jù)字內(nèi)的數(shù)據(jù)進(jìn)行重新定位的可重配置設(shè)備
- 下一篇:壓印介質(zhì)、具有壓印介質(zhì)的印刷系統(tǒng)及其方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)





