[發(fā)明專利]自適應(yīng)視頻場景的行人檢測方法無效
| 申請(qǐng)?zhí)枺?/td> | 201310358963.4 | 申請(qǐng)日: | 2013-08-16 |
| 公開(公告)號(hào): | CN103473570A | 公開(公告)日: | 2013-12-25 |
| 發(fā)明(設(shè)計(jì))人: | 葉茂;占偉鵬;徐培;龐鋒;蔡小路;謝易道 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué);深圳市博康多媒體顯示技術(shù)有限公司 |
| 主分類號(hào): | G06K9/66 | 分類號(hào): | G06K9/66 |
| 代理公司: | 成都宏順專利代理事務(wù)所(普通合伙) 51227 | 代理人: | 周永宏 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 自適應(yīng) 視頻 場景 行人 檢測 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)視覺和模式識(shí)別技術(shù)領(lǐng)域,涉及一種普適于智能視頻監(jiān)控中的行人檢測方法。
背景技術(shù)
智能視頻監(jiān)控技術(shù)是計(jì)算機(jī)視覺領(lǐng)域近年來新興的一個(gè)研究方向,它是一種基于人工智能的計(jì)算機(jī)視覺技術(shù),以視頻場景中的行人、交通工具和運(yùn)動(dòng)物體為研究分析對(duì)象。在智能視頻監(jiān)控研究領(lǐng)域,關(guān)于行人的檢測技術(shù)的研究備受關(guān)注。
在安全和法律方面,智能視頻監(jiān)控系統(tǒng)對(duì)從監(jiān)控?cái)z像機(jī)傳來的監(jiān)控場景的視頻信息進(jìn)行處理,對(duì)場景中可疑的人和事件進(jìn)行報(bào)警,從而阻止犯罪,災(zāi)難性事件的發(fā)生,以保障人民群眾的生命和財(cái)產(chǎn)安全;在交通應(yīng)用上,智能視頻監(jiān)控系統(tǒng)監(jiān)測交通中行人的違法或不安全行為;在商業(yè)活動(dòng)中,智能視頻監(jiān)控系統(tǒng)統(tǒng)計(jì)各購物場所和娛樂場所消費(fèi)者人數(shù),監(jiān)視公眾場合中行人的阻塞情況和擁擠程度以免發(fā)生踩踏事件。在視頻監(jiān)控的場景中,人是活動(dòng)主體,所以監(jiān)控系統(tǒng)必須能實(shí)時(shí)地檢測與識(shí)別出人;在出現(xiàn)人和人遮擋,人和環(huán)境遮擋,光照變化,非剛體輪廓變形,和交接運(yùn)動(dòng)時(shí),也能正常工作。
目前針對(duì)行人安全檢測的研究大多集中在運(yùn)動(dòng)行人的檢測和跟蹤方面,且實(shí)驗(yàn)環(huán)境大都比較理想,對(duì)復(fù)雜環(huán)境和混合交通下的行人檢測還沒用獲得實(shí)時(shí)性、魯棒性都比較好的算法。在行人檢測的技術(shù)方法上,普遍采用基于單目視覺的方法,利用人體邊緣、紋理等特征建立模板并綜合運(yùn)用神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、級(jí)聯(lián)分類器這些機(jī)器學(xué)習(xí)方法。
所以,現(xiàn)有的機(jī)器學(xué)習(xí)方法行人檢測技術(shù)在產(chǎn)生魯棒的行人檢測器上主要面臨三大問題:1)從特定的監(jiān)控場景下提取該場景下行人樣本需花費(fèi)大量的人工成本(需逐幀的手工裁切出行人樣本);2)如若省去人工操作,使用國內(nèi)外開源的行人樣本庫產(chǎn)生得到的行人檢測器只具備一般的普適性,無法在特有場景下展現(xiàn)理想效果;3)對(duì)于現(xiàn)代生活中無窮多的視頻場景,沒有能自動(dòng)適應(yīng)于各類場景產(chǎn)生魯棒高效的行人檢測器。
CN101807260A公開了一種變化場景下行人檢測的方法,該方法通過將第二場景的少量樣本數(shù)據(jù)輔助優(yōu)化級(jí)聯(lián)器,使得級(jí)聯(lián)分類器適應(yīng)于第二場景。但實(shí)際上該方案具有以下三個(gè)缺點(diǎn):1)使用級(jí)聯(lián)分類器來訓(xùn)練行人檢測器需要多層循環(huán)迭代耗費(fèi)大量時(shí)間,遠(yuǎn)遠(yuǎn)大于支持向量機(jī)訓(xùn)練所耗費(fèi)的時(shí)間;2)從第二場景中提取樣本數(shù)據(jù)仍然是手工截取或裁減,耗費(fèi)大量人工成本;3)對(duì)新加入的第二場景樣本與舊場景樣本只是簡單融合調(diào)整,級(jí)聯(lián)生成新的場景下分類器,使得該方法不能自適應(yīng)于無限多個(gè)場景,隨著場景的增加,樣本數(shù)也會(huì)增加,更大的加大了循環(huán)迭代耗費(fèi)的時(shí)間。
CN103106414A公開了一種智能視頻監(jiān)控中行人的檢測方法,該方法通過收集行人數(shù)據(jù)庫,利用支持向量機(jī)訓(xùn)練行人檢測器,并最后對(duì)檢測窗口融合來完成檢測。但實(shí)際上該方案是計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域內(nèi)一種公認(rèn)的基礎(chǔ)方法之一:基于機(jī)器學(xué)習(xí)特征的分類方法,具體通過將收集到的樣本基于某些特征轉(zhuǎn)換為高維向量,通過支持向量機(jī)對(duì)這些高維向量進(jìn)行分類,生成檢測器。但生成的檢測器的效果極大程度上依賴于收集的樣本和支持向量機(jī)的訓(xùn)練方法,并且沒有自適應(yīng)場景的功能,每個(gè)場景下都需要耗費(fèi)大量人工成本制作樣本。
發(fā)明內(nèi)容
本發(fā)明的目的是為了解決現(xiàn)有技術(shù)存在的上述問題,提出了一種自適應(yīng)視頻場景的行人檢測方法。
本發(fā)明的技術(shù)方案為:一種自適應(yīng)視頻場景的行人檢測方法,包括以下步驟:
S1.選取行人的正樣本集P和負(fù)樣本集N;
S2.將正負(fù)樣本集P、N中每一個(gè)樣本轉(zhuǎn)換為特征向量,將所述特征向量作為支持向量機(jī)SVM的輸入,生成初始行人檢測器;
S3.使用初始行人檢測器對(duì)新場景下視頻進(jìn)行檢測,保存所有被檢測出的目標(biāo)圖像,對(duì)保存的圖像分成兩類:準(zhǔn)確包含行人的圖像集合定義為P*,未能準(zhǔn)確包含行人即誤報(bào)圖像的集合定義為N*;
S4.將準(zhǔn)確包含行人的圖像集合P*里的圖像轉(zhuǎn)換成特征向量與正樣本集P所轉(zhuǎn)換成的特征向量進(jìn)行相似度計(jì)算,使用P*替換掉正樣本集P中對(duì)應(yīng)于P*里所有樣本相似度最低的部分樣本,完成新場景下正樣本集的更新;
將未能準(zhǔn)確包含行人即誤報(bào)圖像的集合N*里的圖像轉(zhuǎn)換成特征向量與負(fù)樣本集N所轉(zhuǎn)換成的特征向量進(jìn)行相似度計(jì)算,使用N*替換掉負(fù)樣本集N中對(duì)應(yīng)于N*里所有樣本相似度最低的部分樣本,完成新場景下負(fù)樣本集的更新;
S5.將更新后的正負(fù)樣本集P、N轉(zhuǎn)換成特征向量作為支持向量機(jī)的輸入,生成適用于該場景下的行人檢測器,進(jìn)而完成該場景下的行人檢測;
S6.對(duì)于之后每一次新來場景,可重復(fù)步驟S2到步驟S5的過程。
進(jìn)一步的,上述步驟S2具體包括如下步驟:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué);深圳市博康多媒體顯示技術(shù)有限公司,未經(jīng)電子科技大學(xué);深圳市博康多媒體顯示技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310358963.4/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種治療膽囊炎的組合物中藥
- 下一篇:一種治療肩周炎的組合物中藥
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 使用后向自適應(yīng)規(guī)則進(jìn)行整數(shù)數(shù)據(jù)的無損自適應(yīng)Golomb/Rice編碼和解碼
- 一種自適應(yīng)軟件UML建模及其形式化驗(yàn)證方法
- 媒體自適應(yīng)參數(shù)的調(diào)整方法、系統(tǒng)及相關(guān)設(shè)備
- 五自由度自適應(yīng)位姿調(diào)整平臺(tái)
- 采用自適應(yīng)機(jī)匣和自適應(yīng)風(fēng)扇的智能發(fā)動(dòng)機(jī)
- 一種自適應(yīng)樹木自動(dòng)涂白裝置
- 一種基于微服務(wù)的多層次自適應(yīng)方法
- 一種天然氣發(fā)動(dòng)機(jī)燃?xì)庾赃m應(yīng)控制方法及系統(tǒng)
- 一種中心自適應(yīng)的焊接跟蹤機(jī)頭
- 一種有砟軌道沉降自適應(yīng)式軌道系統(tǒng)
- 電視場景切換的方法及電視
- 視頻場景控制系統(tǒng)及方法
- 場景開關(guān)及其場景開關(guān)構(gòu)件和場景圖標(biāo)卡組件
- 場景聯(lián)動(dòng)方法及場景聯(lián)動(dòng)系統(tǒng)
- 一種視頻場景分類方法、裝置、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種Unity3D引擎的場景切換方法和系統(tǒng)
- 一種自動(dòng)駕駛場景分類識(shí)別系統(tǒng)及方法
- 一種虛擬場景生成方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種汽車圖像場景庫數(shù)據(jù)復(fù)雜度度量方法
- 場景識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 行人畫像的生成及基于畫像的行人識(shí)別
- 一種輔助駕駛方法、裝置、車載終端及車輛
- 行人跟蹤方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于行人重識(shí)別的跨鏡頭的行人檢索方法
- 行人重識(shí)別方法、裝置、電子設(shè)備和計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 行人重識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于深度條件隨機(jī)場的行人重識(shí)別方法和系統(tǒng)
- 行人跟蹤的方法、行人跟蹤裝置以及行人跟蹤系統(tǒng)
- 一種實(shí)時(shí)行人檢測與重識(shí)別方法及裝置
- 一種行人屬性識(shí)別方法、裝置及電子設(shè)備





