[發明專利]基于BING特征的人體目標視覺檢測方法和裝置有效
| 申請號: | 201810374551.2 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108734200B | 公開(公告)日: | 2022-03-08 |
| 發明(設計)人: | 楊戈;黃尚仁;黃靜 | 申請(專利權)人: | 北京師范大學珠海分校 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06V10/764;G06V10/46;G06N3/04 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 邱曉鋒 |
| 地址: | 519087 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 bing 特征 人體 目標 視覺 檢測 方法 裝置 | ||
1.一種基于BING特征的人體目標視覺檢測方法,其特征在于,包括以下步驟:
1)基于BING特征對視頻幀的圖像進行視覺顯著性檢測,篩選出圖像中可能包含人體目標的候選窗口;
2)通過級聯分類器對所述候選窗口進行篩選,根據最終篩選出的候選窗口獲得視頻幀上所有人體目標的位置和尺寸;
其中,步驟1)包括以下子步驟:
1-1)基于BING特征訓練第一級SVM分類器,使用第一級SVM分類器對候選窗口進行篩選,并計算候選窗口的得分;
1-2)基于BING特征訓練第二級SVM分類器,使用第二級SVM分類器對步驟1-1)得到的候選窗口進行篩選,并計算候選窗口的得分,作為對候選窗口區域的顯著性的度量;其中,步驟2)包括以下子步驟:
2-1)基于HOG特征訓練第三級SVM分類器,使用第三級SVM分類器對步驟1)得到的候選窗口進行篩選;
2-2)基于深度卷積特征訓練第四級分類器,使用第四級分類器對步驟2-1)得到的候選窗口進行篩選,獲得最終的所有包含人體目標的候選窗口;
其中,所述第三級SVM分類器在訓練時,首先對于各個候選區域采用HOG特征進行訓練,得到一個線性SVM模型,然后使用該模型對測試集進行檢測,將在檢測過程中獲得的誤檢窗口加入到訓練集的負樣本集合,作為硬樣本,并在加入硬樣本的訓練集上進行訓練,獲得新的SVM模型;
其中,所述第四級分類器使用深度卷積網絡對輸入圖像進行特征提取,獲得深度卷積特征圖,然后將所述第三級SVM分類器篩選出的候選窗口映射到所述深度卷積特征圖上,并獲得每個候選窗口所在區域的特征向量,最終使用Softmax層對各窗口的特征進行分類。
2.如權利要求1所述的方法,其特征在于,訓練所述第一級SVM分類器時使用包含一般目標對象的候選窗口作為正樣品,使用不包含一般目標對象的候選窗口或者與一般目標對象所在候選窗口的重疊率小于50%的候選窗口作為負樣品;訓練所述第二級SVM分類器時使用與一般目標對象所在區域重疊率大于50%的候選窗口作為正樣品,重疊率小于50%的候選窗口則作為負樣品。
3.如權利要求1所述的方法,其特征在于,所述第一級SVM分類器采用以下公式計算候選窗口的得分:
scoreL=w,(NG)2)L,
L=(i,x,y),
其中,L表示位置信息,i表示當前尺度,(x,y)表示當前窗口所在的坐標,(NG)2)L表示在位置L上的窗口的BING特征,w表示線性SVM模型的權值。
4.如權利要求3所述的方法,其特征在于,所述第二級SVM分類器采用以下公式計算候選窗口的得分:
(ScoreF)L=(w1)i×scoreL+(w2)i,
其中,w1表示第一級SVM分類器的權值,w2表示第二級SVM分類器的權值,(ScoreF)L表示L位置所在的候選窗口的最終得分,并使用(ScoreF)L對候選窗口區域的顯著性作最終度量。
5.如權利要求1所述的方法,其特征在于,訓練所述第四級分類器時使用Caffe深度學習框架,并使用擴增的INRIA數據集進行調優訓練。
6.一種采用權利要求1~5中任一權利要求所述方法的基于BING特征的人體目標視覺檢測裝置,其特征在于,包括:
顯著性檢測模塊,負責基于BING特征對視頻幀的圖像進行視覺顯著性檢測,篩選出圖像中可能包含人體目標的候選窗口;
候選窗口篩選模塊,負責通過級聯分類器對所述候選窗口進行篩選,根據最終篩選出的候選窗口獲得視頻幀上所有人體目標的位置和尺寸。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京師范大學珠海分校,未經北京師范大學珠海分校許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810374551.2/1.html,轉載請聲明來源鉆瓜專利網。





