[發(fā)明專利]基于局部評估和全局優(yōu)化的注視點檢測方法有效
| 申請?zhí)枺?/td> | 201710024964.3 | 申請日: | 2017-01-16 |
| 公開(公告)號: | CN106778687B | 公開(公告)日: | 2019-12-17 |
| 發(fā)明(設(shè)計)人: | 李建華;姜博;盧湖川 | 申請(專利權(quán))人: | 大連理工大學(xué) |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 21200 大連理工大學(xué)專利中心 | 代理人: | 梅洪玉;侯明遠 |
| 地址: | 116024 遼*** | 國省代碼: | 遼寧;21 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 局部 評估 全局 優(yōu)化 注視 檢測 方法 | ||
1.基于局部評估和全局優(yōu)化的注視點檢測方法,其特征在于,步驟如下:
(1)提取待檢測圖像上存在物體的區(qū)域,以檢測到的候選目標(biāo)作為后續(xù)處理的基本單位;
(2)利用微調(diào)后的卷積神經(jīng)網(wǎng)絡(luò)提取候選目標(biāo)的深度特征;
(3)局部評估的總體訓(xùn)練:根據(jù)候選目標(biāo)的深度特征評估該區(qū)域受注視的程度,采用自頂向下的監(jiān)督學(xué)習(xí)方式訓(xùn)練分類器,評判每一個候選目標(biāo)是人眼注視區(qū)域的可能性;首先,根據(jù)注視點信息的真值,從訓(xùn)練集圖像的候選框中挑出訓(xùn)練樣本框;然后,利用訓(xùn)練集圖像的樣本框的深度特征訓(xùn)練支持向量機SVM;在測試階段,把測試集圖像的候選目標(biāo)輸入支持向量機,得到對應(yīng)的評估分?jǐn)?shù);
(4)局部評估的具體訓(xùn)練:采用半耦合字典學(xué)習(xí)算法,實現(xiàn)一張圖像對應(yīng)一個分類器;給定一張圖像I,通過卷積神經(jīng)網(wǎng)絡(luò)得到其深度特征xI;再從圖像I中選取100個正負樣本訓(xùn)練SVM,得到SVM的權(quán)重向量wI;對于訓(xùn)練集圖像S,候選目標(biāo)特征集合為其中每一列代表一張圖像的深度特征,d為特征向量維數(shù),N為數(shù)據(jù)庫中圖像個數(shù);對應(yīng)的SVM權(quán)重向量集合為分別定義為特征字典、權(quán)重字典、映射字典;k是字典大小;那么,字典的聯(lián)合優(yōu)化問題的公式如下:
Φ=Edata(DX,XS)+Edata(DW,WS)+Emap(M)+Ereg(ΛX,ΛW,M,DX,DW) (2)
上式中ΛX和ΛW代表編碼系數(shù),Edata(·,·)代表重構(gòu)誤差,Emap(·)代表映射誤差項,Ereg(·)是編碼系數(shù),映射矩陣和字典的正則項;通過求解,根據(jù)其深度特征得到對應(yīng)的SVM,實現(xiàn)對待檢測圖像的具體評估任務(wù);
(5)對局部評估得到的結(jié)果使用proposal子集優(yōu)化算法,proposal為物體目標(biāo):刪除空間位置上孤立的高分框,保留空間位置密集高分框,通過減少離群值增加局部評估的置信度;進一步將密集高分框聚類,原則如下:
1)減少聚類個數(shù);
2)同一類中的候選目標(biāo)重疊且相似;
3)降低不同類的聚類中心重疊;
(6)設(shè)計新的特征訓(xùn)練回歸模型對受注視程度進行預(yù)測,新特征包括候選目標(biāo)的全局對比度、邊界對比度、局部評估的分?jǐn)?shù);在算法總體框架上,采用局部評估與全局優(yōu)化兩個階段,分別體現(xiàn)候選目標(biāo)的自身特征和所處的圖像上下文環(huán)境。
2.根據(jù)權(quán)利要求1所述的注視點檢測方法,其特征在于,步驟(1)提取方式采用edgeboxes算法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于大連理工大學(xué),未經(jīng)大連理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710024964.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于靈活柵格光網(wǎng)絡(luò)全局優(yōu)化的系統(tǒng)架構(gòu)及其全局優(yōu)化方法
- 一種基于多數(shù)據(jù)庫類型的SQL執(zhí)行方法和裝置
- 用于移動AdHoc網(wǎng)絡(luò)的路由入侵檢測系統(tǒng)
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 全局資源分配方法和裝置
- 一種通信方法及裝置
- 一種高效分布式全局鎖協(xié)調(diào)方法
- 一種帶上下文信息編碼的語義分割卷積神經(jīng)網(wǎng)絡(luò)
- 一種批量腳本的全局參數(shù)替換方法及裝置
- 一種基于全局變量的家居參數(shù)化模型建模系統(tǒng)及方法





