[發(fā)明專(zhuān)利]一種基于加權(quán)金字塔結(jié)構(gòu)的圖像特征提取方法在審
| 申請(qǐng)?zhí)枺?/td> | 201210475799.0 | 申請(qǐng)日: | 2012-11-21 |
| 公開(kāi)(公告)號(hào): | CN103839063A | 公開(kāi)(公告)日: | 2014-06-04 |
| 發(fā)明(設(shè)計(jì))人: | 李圣;田宏;黃曙光 | 申請(qǐng)(專(zhuān)利權(quán))人: | 大連靈動(dòng)科技發(fā)展有限公司 |
| 主分類(lèi)號(hào): | G06K9/46 | 分類(lèi)號(hào): | G06K9/46;G06T7/00 |
| 代理公司: | 大連東方專(zhuān)利代理有限責(zé)任公司 21212 | 代理人: | 曲永祚 |
| 地址: | 116023 遼寧*** | 國(guó)省代碼: | 遼寧;21 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 加權(quán) 金字塔結(jié)構(gòu) 圖像 特征 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像特征方法,特別是一種基于加權(quán)金字塔結(jié)構(gòu)的方法。
背景技術(shù)
無(wú)論是孩童學(xué)看畫(huà),還是成人對(duì)圖像的理解首先是對(duì)圖像中感興趣的、典型的、有意義圖像塊的認(rèn)識(shí),然后再通過(guò)對(duì)整幅圖像中這些圖像塊之間的空間結(jié)構(gòu)關(guān)系、布局以及更高層的語(yǔ)義理解,最后綜合成對(duì)整幅圖像的理解。把那些具有典型意義的圖像塊稱(chēng)為圖元,具有典型意義圖元的提取和語(yǔ)義分析是整幅圖像語(yǔ)義分析的基礎(chǔ)。圖像典型意義圖元提取的問(wèn)題本質(zhì)上是圖像分割問(wèn)題。圖像分割是圖像分析和理解中的一項(xiàng)基本內(nèi)容,成為圖像內(nèi)容檢索系統(tǒng)中一個(gè)基礎(chǔ)而又非常關(guān)鍵的部分。現(xiàn)有的很多系統(tǒng)僅僅根據(jù)整幅圖像的低層特征進(jìn)行檢索,圖像中可能包含了大量不相關(guān)的信息。這些不相關(guān)的信息在提取出的特征中占了很大的比例的話(huà),提出的特征就不能夠準(zhǔn)確地反映檢索的要求,檢索的結(jié)果中就可能出現(xiàn)大量不相關(guān)的結(jié)果,即使采用相關(guān)反饋等技術(shù)手段也難以取得比較令人滿(mǎn)意的檢索結(jié)果。事實(shí)上,人們判斷圖像的相似性并非僅僅建立在整幅圖像底層特征的相似性上,基于內(nèi)容檢索的初衷是想根據(jù)人對(duì)圖像的理解和認(rèn)識(shí)來(lái)衡量圖像間的相似性進(jìn)行檢索的,這種人對(duì)圖像的理解可表示成圖像的高層語(yǔ)義。
為了實(shí)現(xiàn)更為貼近用戶(hù)的自然而簡(jiǎn)潔的查詢(xún)方式,并提高圖像檢索的精度,必須實(shí)現(xiàn)由圖像底層次特征推知高層次語(yǔ)義,從而使用高層語(yǔ)義進(jìn)行圖像檢索。為此需要解決兩方面的基本問(wèn)題:一是提供高層語(yǔ)義的描述方式;二是應(yīng)有將低層圖像視覺(jué)特征映射到高層語(yǔ)義的方法。從目前現(xiàn)狀來(lái)看,并沒(méi)有從本質(zhì)上解決視覺(jué)特征和語(yǔ)義之間的關(guān)聯(lián)問(wèn)題,“語(yǔ)義鴻溝”依然存在,如何提取圖像語(yǔ)義成為基于內(nèi)容的圖像檢索領(lǐng)域最具挑戰(zhàn)性的難題。
發(fā)明內(nèi)容
基于加權(quán)金字塔結(jié)構(gòu)的圖像特征提取方法是借鑒人類(lèi)基于圖元的圖像內(nèi)容理解思想、從人類(lèi)對(duì)圖像整體和局部的認(rèn)知順序和認(rèn)知程度出發(fā)的一種簡(jiǎn)化的多層次圖像特征提取手段。
為了實(shí)現(xiàn)上述目的,本發(fā)明的技術(shù)方案如下:一種基于加權(quán)金字塔結(jié)構(gòu)的圖像特征提取方法,包括以下步驟:
A、圖像分層
將圖像按照金字塔結(jié)構(gòu)分為三層。金字塔中的每一層來(lái)都代表著整幅圖像,在圖像理解過(guò)程中都發(fā)揮著相同的作用。
A1、第一層
每一幅圖像都會(huì)表達(dá)一個(gè)完整的高層語(yǔ)義,即一幅圖像是一個(gè)整體,它蘊(yùn)涵著圖像中各個(gè)圖元之間的空間、時(shí)間和語(yǔ)義關(guān)系,而且它在人類(lèi)對(duì)圖像的理解過(guò)程中起著至關(guān)重要的作用,因此,把整個(gè)圖像當(dāng)成金字塔第一層;
A2、第二層
兼顧到人類(lèi)攝影的習(xí)慣及盡量保持圖像中每個(gè)圖元的完整性,提高圖像中主要圖元在整幅圖像理解過(guò)程中的作用,我們采用如圖1所示的方式對(duì)圖像進(jìn)行切分,作為金字塔結(jié)構(gòu)的第二層;
A3、第三層
作為對(duì)第一層和第二層切分方式的補(bǔ)充和完善,將圖像切割成4*4個(gè)小塊,作為金字塔結(jié)構(gòu)的第三層。
B、分層加權(quán)
上述的多層次的圖像分割手段,可以將圖像分成22個(gè)子圖像塊,但每個(gè)子圖像存在尺寸大小上的差異,在圖像內(nèi)容理解過(guò)程中所起的作用也不一樣。因此,為了衡量各個(gè)子圖像塊在理解過(guò)程中所發(fā)揮的作用,需要對(duì)每個(gè)圖像塊進(jìn)行加權(quán)處理。對(duì)于金字塔中的每一層來(lái)說(shuō),其都代表著一幅整體的圖像,因此我們?cè)O(shè)每層結(jié)構(gòu)的整體權(quán)重,顯然Wg=1:
同時(shí),對(duì)于每層中的子圖像塊,設(shè)其權(quán)重為:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于大連靈動(dòng)科技發(fā)展有限公司,未經(jīng)大連靈動(dòng)科技發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210475799.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:核生化防爆球
- 下一篇:室內(nèi)行走防碰撞方法及系統(tǒng)
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于單晶硅襯底上多孔金字塔結(jié)構(gòu)的制造方法
- 太陽(yáng)能電池及其制造方法
- 半導(dǎo)體模板襯底、使用半導(dǎo)體模板襯底的發(fā)光元件及其制造方法
- 制作微納金字塔氮化鎵基垂直結(jié)構(gòu)發(fā)光二極管陣列的方法
- 多孔金字塔減反射結(jié)構(gòu)制備方法及HIT太陽(yáng)能電池制備工藝
- 一種非光刻技術(shù)制備倒金字塔結(jié)構(gòu)硅表面的方法
- 混合太陽(yáng)能電池及其制備方法、空穴輸運(yùn)層形成方法
- 單晶硅基納米倒金字塔結(jié)構(gòu)背鈍化太陽(yáng)電池
- 垂直金字塔結(jié)構(gòu)LED及其制備方法
- 納米倒金字塔-準(zhǔn)微米金字塔背鈍化太陽(yáng)電池及制法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





