[發(fā)明專利]一種基于信息熵的時(shí)空顯著性視覺注意方法有效
| 申請?zhí)枺?/td> | 201010192240.8 | 申請日: | 2010-06-06 |
| 公開(公告)號: | CN101853513A | 公開(公告)日: | 2010-10-06 |
| 發(fā)明(設(shè)計(jì))人: | 魏龍生;桑農(nóng);王岳環(huán) | 申請(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號: | G06T7/20 | 分類號: | G06T7/20 |
| 代理公司: | 華中科技大學(xué)專利中心 42201 | 代理人: | 曹葆青 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 信息 時(shí)空 顯著 視覺 注意 方法 | ||
1.一種基于信息熵的時(shí)空顯著性視覺注意方法,其步驟包括:
第1步?提取短視頻中的動(dòng)態(tài)顯著性圖和靜態(tài)顯著性圖;其中,動(dòng)態(tài)顯著性圖的提取過程為:
(A.1)對于輸入的短視頻,取連續(xù)n幀圖像序列,將每一幀圖像轉(zhuǎn)換成更低水平的灰度級圖像;
(A.2)將步驟(A.1)得到的每一幀圖像縮小到4個(gè)不同的尺度,將相同尺度下的n幀縮小的圖像組合成1個(gè)動(dòng)態(tài)的響應(yīng)圖,再將尺度較大的3個(gè)動(dòng)態(tài)響應(yīng)圖縮小到與其中最小尺度響應(yīng)圖相同的尺度,然后利用這4個(gè)相同尺度的縮小的圖像聯(lián)合生成動(dòng)態(tài)顯著性圖;
第2步?將靜態(tài)顯著性圖和動(dòng)態(tài)顯著性圖聯(lián)合生成最終顯著性圖;
第3步?勝者全贏:
對于最終顯著性圖中的每一點(diǎn)ψ,根據(jù)熵的最大化方法獲得了一個(gè)最優(yōu)的尺寸ψr,再計(jì)算該點(diǎn)在一個(gè)局部區(qū)域內(nèi)的均值,這個(gè)局部區(qū)域是以該點(diǎn)為圓心,以ψr為半徑的圓形區(qū)域,所有的均值構(gòu)成了一個(gè)圖,該圖中最大值的點(diǎn)即為最顯著的點(diǎn),最顯著的點(diǎn)和該點(diǎn)對應(yīng)的最優(yōu)尺寸構(gòu)成了最顯著的區(qū)域。
第4步?返回抑制:
將最終顯著性圖中最顯著的區(qū)域的像素值都置為零,得到了一個(gè)新的最終顯著性圖;
第5步?注意選擇:
重復(fù)第3步至第5步,直至預(yù)先設(shè)定的次數(shù),完成后得到的最顯著性的點(diǎn)和該點(diǎn)所在區(qū)域的尺寸,作為注意焦點(diǎn)。
2.根據(jù)權(quán)利要求1所述的基于信息熵的時(shí)空顯著性視覺注意方法,其特征在于:步驟(A.1)中,按照下述過程將每一幀圖像轉(zhuǎn)換成更低水平的灰度級圖像:
將每一幀由256個(gè)灰度級轉(zhuǎn)變成n個(gè)灰度級;設(shè)所有幀中最大的像素值是Max,對于第k幀Vk中坐標(biāo)點(diǎn)(x,y),1≤k≤n,將該點(diǎn)對應(yīng)的像素值Vk(x,y)除以Max得到f(x,y,k),f(x,y,k)的取值范圍在[0,1]的區(qū)間內(nèi);再將[0,1]區(qū)間平均分為n等分,然后給落入不同等分中的f(x,y,k)賦予不同的整數(shù)值g(x,y,k),這些整數(shù)的取值范圍是[0,n-1],以g(x,y,k)作為第k幀Vk中坐標(biāo)點(diǎn)(x,y)的像素值。
3.根據(jù)權(quán)利要求2所述的基于信息熵的時(shí)空顯著性視覺注意方法,其特征在于:步驟(A.2)具體包括下述過程:
(A.2.1)將每一幀圖縮小到4個(gè)不同的尺度,以第k幀Vk為例,Vk被縮小到Vk,1,Vk,2,Vk,3和Vk,44個(gè)不同的尺度,分別是原圖尺寸的1/2,1/4,1/8和1/16,所述的連續(xù)n幀圖像序列變成為4個(gè)圖像序列V1,s,V2,s,K,Vn,s,s表示尺度的序號,1≤s≤4,這4個(gè)圖像序列分別記為V1,1,V2,1,K,Vn,1,V1,2,V2,2,K,Vn,2,V1,3,V2,3,K,Vn,3和V1,4,V2,4,K,Vn,4;設(shè)Rs(x,y)是第s個(gè)圖像序列在坐標(biāo)點(diǎn)(x,y)處的一個(gè)局部區(qū)域,這個(gè)局部區(qū)域是以(x,y)為圓心,以Vn,4的長度和寬度值中最小值的一半為半徑的圓形區(qū)域;
(A.2.2)對于第s個(gè)圖像序列中的坐標(biāo)點(diǎn)(x,y),該序列中在(x,y)處的局部區(qū)域內(nèi)的所有的g(x,y,k)構(gòu)成了一個(gè)直方圖,該點(diǎn)的熵值是通過此直方圖的概率塊函數(shù)得到的,如式I所示;所有的熵值構(gòu)成了一個(gè)在當(dāng)前尺度s下的動(dòng)態(tài)的響應(yīng)圖Md,s(x,y):
其中
(x′,y′)∈Rs(x,y)
pg(x′,y′,k)是由直方圖產(chǎn)生的概率塊函數(shù),此直方圖是由第s個(gè)圖像序列在局部區(qū)域Rs(x,y)中的所有像素值得到的;
(A.2.3)將尺度較大的3個(gè)響應(yīng)圖Md,s(x,y)都縮小到與其中最小尺度響應(yīng)圖相同的尺度,然后聯(lián)合生成動(dòng)態(tài)顯著性圖Md(x,y):
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010192240.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置
- 一種時(shí)空地理大數(shù)據(jù)的檢索方法及系統(tǒng)
- 一種泛知識化時(shí)空對象表達(dá)數(shù)據(jù)庫建立方法
- 一種基于時(shí)空密度波與同步的大型時(shí)空數(shù)據(jù)聚類算法GRIDWAVE
- 時(shí)空數(shù)據(jù)的存儲(chǔ)方法、查詢方法及存儲(chǔ)裝置、查詢裝置
- 一種云環(huán)境下時(shí)空索引的構(gòu)建方法、裝置及電子設(shè)備
- 面向工業(yè)4.0的時(shí)空大數(shù)據(jù)分布式存儲(chǔ)檢索方法及系統(tǒng)
- 一種數(shù)據(jù)比對碰撞方法和裝置
- 時(shí)空數(shù)據(jù)的異常檢測方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種可直接捕獲時(shí)空相關(guān)性的時(shí)空數(shù)據(jù)預(yù)測方法
- 多維時(shí)空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)





