[發(fā)明專利]一種視覺目標上下文空間關(guān)系編碼的系統(tǒng)和方法有效
| 申請?zhí)枺?/td> | 200710177656.0 | 申請日: | 2007-11-19 |
| 公開(公告)號: | CN101159043A | 公開(公告)日: | 2008-04-09 |
| 發(fā)明(設(shè)計)人: | 苗軍;卿來云;段立娟;陳熙霖;高文;喬元華 | 申請(專利權(quán))人: | 中國科學(xué)院計算技術(shù)研究所;中國科學(xué)院研究生院;北京工業(yè)大學(xué) |
| 主分類號: | G06N3/06 | 分類號: | G06N3/06;G06K9/46 |
| 代理公司: | 北京律誠同業(yè)知識產(chǎn)權(quán)代理有限公司 | 代理人: | 梁揮;陳振 |
| 地址: | 100080北京*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 視覺 目標 上下文 空間 關(guān)系 編碼 系統(tǒng) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別和神經(jīng)元網(wǎng)絡(luò)技術(shù)領(lǐng)域,特別是涉及一種以神經(jīng)元網(wǎng)絡(luò)形式實現(xiàn)的、用于表達視覺圖像目標上下文空間關(guān)系編碼的系統(tǒng)和方法。
背景技術(shù)
視覺目標的上下文關(guān)系是指圖像任意兩個目標之間的空間相對關(guān)系。其中目標可以是圖像中的任何內(nèi)容,包括簡單目標和復(fù)雜目標,前者如一段邊緣、一個形狀、一段輪廓或一個較緊湊的單一紋理區(qū)域;后者由前者組成,如人臉、人臉面部的各個感官等。
一般地,除了特別指定以外,兩個目標之間的空間關(guān)系一般以各自中心點之間的連線的方向和距離表示。
在現(xiàn)有技術(shù)中,對視覺目標上下文關(guān)系進行編碼主要包括兩個部分:對兩個視覺目標的編碼和對視覺目標相對空間關(guān)系的編碼。
目前關(guān)于視覺目標上下文關(guān)系的表示,普遍采用基于概率統(tǒng)計框架的模型方法,例如貝葉斯網(wǎng)或馬爾可夫場模型。
歐洲專利申請WO2004111931公開了一種視覺注意選擇系統(tǒng)和方法(ASystem?And?Method?for?Attentional?Selection)。其基于自下而上的視覺注意,它能夠自動選擇和分離可能包含對象的顯著區(qū)域。其主要工作體現(xiàn)在接受輸入圖像,自動分割出顯著區(qū)域,得到一張顯著映射圖,能夠直接定位顯著對象的位置,因此,可以產(chǎn)生僅僅包括顯著對象的掩碼圖像,并把這些分隔結(jié)果顯示給用戶,這樣識別系統(tǒng)就可以在僅有顯著對象的圖上進行對象識別,而舍棄了一些無關(guān)的、不重要或者干擾的因素。
同時,美國專利公開文獻US5664065,US2002154833,US2005047647,日本專利公開文獻JP2002373333,以及中國專利公開文獻申請?zhí)枮椋?9810425.6,200380103136.5,200410035084也公開了一些現(xiàn)有的視覺目標上下文關(guān)系的表示系統(tǒng)和方法,其主要是關(guān)于視覺選擇性注意、圖像目標表達和跟蹤的技術(shù)。但是,現(xiàn)有技術(shù)中,并沒有以神經(jīng)元網(wǎng)絡(luò)形式表達的關(guān)于視覺上下文空間關(guān)系的編碼表示,無法更好地對視覺上下文關(guān)系進行表示。
發(fā)明內(nèi)容
本發(fā)明所要解決的問題在于提供一種視覺目標上下文空間關(guān)系編碼的系統(tǒng)和方法,其具有極大的靈活性和自適應(yīng)性。
為實現(xiàn)本發(fā)明目的而提供的一種視覺目標上下文空間關(guān)系編碼的系統(tǒng),其以神經(jīng)元網(wǎng)絡(luò)形式實現(xiàn);
包括視覺圖像基元編碼神經(jīng)元層、視覺圖像目標編碼神經(jīng)元層、視覺圖像目標邏輯關(guān)系編碼神經(jīng)元層和視覺目標空間關(guān)系編碼神經(jīng)元層;
所有相鄰兩層神經(jīng)元之間的連接權(quán)值構(gòu)成了對圖像內(nèi)容的編碼,每個編碼神經(jīng)元及其連接權(quán)值分別編碼圖像基元、圖像目標、目標二元邏輯關(guān)系和目標空間關(guān)系。
所述的視覺目標上下文空間關(guān)系編碼的系統(tǒng),還包括一圖像傳感輸入神經(jīng)元層,用于圖像輸入。
所述圖像傳感輸入神經(jīng)元層構(gòu)成的神經(jīng)元與圖像上的等間隔像素采樣一一對應(yīng),而神經(jīng)元的響應(yīng)值取對應(yīng)的像素值。
所述視覺圖像基元編碼神經(jīng)元層、視覺圖像目標編碼神經(jīng)元層、視覺圖像目標邏輯關(guān)系編碼神經(jīng)元層和視覺目標空間關(guān)系編碼神經(jīng)元層編碼分別采用稀疏特征、赫布學(xué)習(xí)權(quán)值特征、連接特征和距離特征作為編碼的基本要素,四個編碼層分別由稀疏編碼神經(jīng)元組成。
為實現(xiàn)本發(fā)明目的還提供一種視覺目標上下文空間關(guān)系編碼的方法,包括下列步驟:
步驟A,根據(jù)局部圖像傳感神經(jīng)元的像素值,計算得到視覺圖像基元編碼神經(jīng)元的編碼值和響應(yīng)值;
步驟B,根據(jù)視覺圖像基元編碼神經(jīng)元的響應(yīng),計算得到視覺圖像目標編碼神經(jīng)元的編碼值和響應(yīng)值;
步驟C,根據(jù)任意兩個有關(guān)聯(lián)的視覺圖像目標編碼神經(jīng)元的響應(yīng)值,計算得到視覺圖像目標邏輯關(guān)系編碼神經(jīng)元的編碼值和響應(yīng)值;
步驟D,根據(jù)圖像目標之間的空間關(guān)系,計算得到視覺目標空間關(guān)系編碼神經(jīng)元的編碼值。
所述步驟C中的邏輯關(guān)系為二元邏輯關(guān)系。
所述步驟D中,還包括計算得到視覺目標空間關(guān)系編碼神經(jīng)元的響應(yīng)值的步驟。
所述步驟A中,15個視覺圖像基元編碼神經(jīng)元的編碼值(wi1,wi2,wi3,wi4)是根據(jù)2×2像素的15種組合對應(yīng)的權(quán)值,經(jīng)過歸一化處理而得到;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計算技術(shù)研究所;中國科學(xué)院研究生院;北京工業(yè)大學(xué),未經(jīng)中國科學(xué)院計算技術(shù)研究所;中國科學(xué)院研究生院;北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710177656.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:擴徑機頂起機構(gòu)
- 下一篇:拋灑式太陽能紅外發(fā)光錐





