[發(fā)明專(zhuān)利]一種自適應(yīng)多特征融合的圖像特征學(xué)習(xí)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201310342023.6 | 申請(qǐng)日: | 2013-08-07 |
| 公開(kāi)(公告)號(hào): | CN103426006A | 公開(kāi)(公告)日: | 2013-12-04 |
| 發(fā)明(設(shè)計(jì))人: | 毛金蓮 | 申請(qǐng)(專(zhuān)利權(quán))人: | 浙江商業(yè)職業(yè)技術(shù)學(xué)院 |
| 主分類(lèi)號(hào): | G06K9/66 | 分類(lèi)號(hào): | G06K9/66 |
| 代理公司: | 杭州求是專(zhuān)利事務(wù)所有限公司 33200 | 代理人: | 張法高 |
| 地址: | 310053 浙*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 自適應(yīng) 特征 融合 圖像 學(xué)習(xí)方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及稀疏表達(dá),圖學(xué)習(xí),特征學(xué)習(xí),尤其涉及多特征融合的圖像特征學(xué)習(xí)。
背景技術(shù)
在計(jì)算機(jī)視覺(jué)、模式識(shí)別和信息檢索領(lǐng)域中,由于不可避免地面臨著語(yǔ)義鴻溝問(wèn)題,即底層特征無(wú)法充分準(zhǔn)確地表達(dá)高層語(yǔ)義信息;因此,為了盡可能全面準(zhǔn)確地表達(dá)所要描述的對(duì)象,常會(huì)對(duì)該對(duì)象提取多種類(lèi)型的視覺(jué)特征,從不同視角來(lái)對(duì)其進(jìn)行表達(dá)。例如:在圖像分類(lèi)中,對(duì)彩色圖像常會(huì)提取其顏色直方圖特征、輪廓矩特征、紋理特征、sift點(diǎn)特征等。與傳統(tǒng)的基于單類(lèi)型特征表達(dá)對(duì)象不同,這些特征數(shù)據(jù),分布在不同的特征空間中,具有其內(nèi)在統(tǒng)計(jì)特性和現(xiàn)實(shí)物理意義,其表達(dá)能力(或辨別能力)也存在差異性。為了充分利用不同特征的特性,加速算法處理,常常需要依據(jù)這些多特征進(jìn)行多特征學(xué)習(xí),得到最優(yōu)的低維特征表達(dá)。
研究者們希望通過(guò)利用多特征學(xué)習(xí)充分發(fā)掘出不同特征間的互補(bǔ)信息,從而得到一個(gè)比直接利用單特征學(xué)習(xí)更加好的低維嵌套結(jié)果。在已有的算法中,譜嵌套算法具有非常重要的地位。然后,傳統(tǒng)的譜嵌套算法都是假設(shè)數(shù)據(jù)是分布在同一個(gè)向量空間中,因而無(wú)法直接應(yīng)用到多特征學(xué)習(xí)中。目前存在的解決辦法有兩個(gè):一個(gè)是將不同的特征先拼接起來(lái),然后進(jìn)行譜嵌套學(xué)習(xí)。顯然這種做法缺乏明確的物理意義支持。另外一種做法是使用分布式譜嵌套學(xué)習(xí)(DSE)算法,對(duì)不同的特征分別進(jìn)行學(xué)習(xí)。然而這種方法中原始的多特征數(shù)據(jù)對(duì)于最終的學(xué)習(xí)過(guò)程是不可見(jiàn)的,無(wú)法充分有效地利用不同特征間的互補(bǔ)信息。在Long等人提出的多特征學(xué)習(xí)通用模型的影響下,Xia等人提出了一個(gè)多特征譜嵌套算法,同時(shí)在不同特征學(xué)習(xí)得到一個(gè)低維的、足夠平滑的嵌套,從而充分有效地利用不同特征間的互補(bǔ)信息。
然而,由于絕大部分多視角學(xué)習(xí)算法都是基于譜圖理論發(fā)展而來(lái)的,其算法的一個(gè)核心部分是利用各種準(zhǔn)則構(gòu)建表達(dá)數(shù)據(jù)間空間結(jié)構(gòu)關(guān)系的鄰接矩陣(相似矩陣)。鄰接矩陣的構(gòu)造算法的有效性對(duì)于整個(gè)算法的性能起到至關(guān)重要的作用。目前廣泛使用的兩種鄰接矩陣構(gòu)建方法:基于K近鄰和基于熱核(heat?kernel)的構(gòu)圖方法,都不是數(shù)據(jù)自適應(yīng)的構(gòu)圖方法。前者需要預(yù)先設(shè)置近鄰節(jié)點(diǎn)數(shù)目k,而后者需要設(shè)置核參數(shù)。在實(shí)際應(yīng)用中,這兩個(gè)參數(shù)的設(shè)置往往是憑借經(jīng)驗(yàn)或者是利用交叉驗(yàn)證的方式來(lái)選擇最佳的參數(shù),缺乏簡(jiǎn)單直接的方法來(lái)獲得最佳參數(shù)。與此同時(shí),這類(lèi)基于圖的算法,對(duì)于這兩個(gè)參數(shù)的選擇有時(shí)又是非常敏感的。參數(shù)選擇的好壞直接影響到算法的性能。因此,前面所提到的幾個(gè)已有工作都受到缺乏數(shù)據(jù)自適應(yīng)性問(wèn)題的困擾。如何構(gòu)建具有數(shù)據(jù)自適應(yīng)性的圖,提高算法的自適應(yīng)性,是一個(gè)迫切需要解決的問(wèn)題。
近些年來(lái),L1范數(shù)在稀疏表達(dá)和壓縮感知研究領(lǐng)域中受到廣泛關(guān)注。不同于傳統(tǒng)的L2范數(shù)約束,L1范數(shù)約束可以使得問(wèn)題的解變得稀疏,具有更強(qiáng)的抗噪能力。根據(jù)Cheng等人的研究表明,L1圖具有三個(gè)重要特性:(1)抗噪聲能力強(qiáng);(2)稀疏性;(3)數(shù)據(jù)自適應(yīng)的鄰域關(guān)系。
承上所述,為了克服傳統(tǒng)的基于圖的多特征學(xué)習(xí)算法自適應(yīng)性差的問(wèn)題,本文所提出的自適應(yīng)多特征融合的圖像特征學(xué)習(xí)方法是依據(jù)L1范數(shù)具有自動(dòng)數(shù)據(jù)樣本選擇的特性,首先從圖像上分別提取多種類(lèi)型的圖像視覺(jué)特征,接著對(duì)每一種視覺(jué)特征分別采用L1范數(shù)約束的數(shù)據(jù)稀疏表達(dá),構(gòu)建有向L1圖,將L1圖所具有的優(yōu)良特性融入到多特征學(xué)習(xí)算法中,并最下化各種特征下的數(shù)據(jù)在低維空間上的重建誤差,其次引入特征權(quán)重向量對(duì)所有特征做全局坐標(biāo)對(duì)齊操作,得到自適應(yīng)多特征融合的圖像特征選擇方法的目標(biāo)函數(shù),最后優(yōu)化求解該目標(biāo)函數(shù),可以自適應(yīng)地從原始多種圖像特征基礎(chǔ)上學(xué)習(xí)得到圖像最優(yōu)的低維特征表達(dá)。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有技術(shù)的不足,提出一種自適應(yīng)多特征融合的圖像特征學(xué)習(xí)方法。
自適應(yīng)多特征融合的圖像特征學(xué)習(xí)方法在于包括如下步驟:
1)從N幅圖像上分別提取K種類(lèi)型的圖像視覺(jué)特征其中為第i幅圖像上所提取的第v種類(lèi)型的視覺(jué)特征;
2)依據(jù)L1范數(shù)具有自動(dòng)數(shù)據(jù)特征選擇的特性,對(duì)每一種視覺(jué)特征分別采用L1范數(shù)約束的數(shù)據(jù)稀疏表達(dá):
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于浙江商業(yè)職業(yè)技術(shù)學(xué)院,未經(jīng)浙江商業(yè)職業(yè)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310342023.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:標(biāo)本固定瓶
- 下一篇:邊封型材側(cè)板
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無(wú)損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹(shù)木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





