[發(fā)明專利]一種改進(jìn)型PCCNN神經(jīng)網(wǎng)絡(luò)模型的人群聚集檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710564899.3 | 申請(qǐng)日: | 2017-07-12 |
| 公開(kāi)(公告)號(hào): | CN107341480A | 公開(kāi)(公告)日: | 2017-11-10 |
| 發(fā)明(設(shè)計(jì))人: | 王賢哲;劉格;丁頠洋;袁翔;程浚;袁林;馮燕來(lái);宮明煜;張昕然;章邢;雷玉鵬;李莎莎 | 申請(qǐng)(專利權(quán))人: | 中國(guó)電子科技集團(tuán)公司第二十八研究所 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06N3/08 |
| 代理公司: | 南京蘇高專利商標(biāo)事務(wù)所(普通合伙)32204 | 代理人: | 孟紅梅 |
| 地址: | 210003 *** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 改進(jìn)型 pccnn 神經(jīng)網(wǎng)絡(luò) 模型 人群 聚集 檢測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于視頻圖像處理領(lǐng)域,主要涉及一種改進(jìn)型PCCNN神經(jīng)網(wǎng)絡(luò)模型的人群聚集檢測(cè)方法。
背景技術(shù)
目前針對(duì)人群聚集的檢測(cè)方法,主要集中在圖像分割、前景提取,紋理特征識(shí)別等傳統(tǒng)數(shù)字圖像處理技術(shù)。
在傳統(tǒng)的視頻人群聚集分析領(lǐng)域,一般通過(guò)幀間差分法、光流法、(混合)背景建模法等對(duì)關(guān)注目標(biāo)進(jìn)行前景提取,在前景提取前會(huì)選擇性采用圖像去噪、背景生成等預(yù)處理手段。但是由于圖像背景復(fù)雜度的增加,各類算法的計(jì)算復(fù)雜度也顯著增加,建模的難度也成規(guī)模提升。同時(shí),由于場(chǎng)景的干擾因素較多,如光照環(huán)境變化,目標(biāo)遮擋等,都對(duì)計(jì)算分析造成了極大的干擾。而且特征提取中的目標(biāo)特征確定也十分繁雜,目標(biāo)以外的背景也使得提取局部特征時(shí)會(huì)帶入大量的噪聲和干擾。
在前景提取完成后,往往對(duì)人群的數(shù)量估計(jì)采用的是基于提取前景的像素特征,該特征在前景提取效果較差、人數(shù)較多、人群重疊、遮擋物較多時(shí)得到的結(jié)果誤差很大。
隨著GPU計(jì)算能力的提升和神經(jīng)網(wǎng)絡(luò)理論的成熟,以機(jī)器學(xué)習(xí)為代表的人工智能方法成為了一種提取大量有效特征的可行方法,是視頻圖像處理領(lǐng)域的嶄新方向,對(duì)于人群聚集的視頻檢測(cè)提供了新的途徑。
發(fā)明內(nèi)容
發(fā)明目的:本發(fā)明針對(duì)安防監(jiān)控活動(dòng)中現(xiàn)有系統(tǒng)很難主動(dòng)檢測(cè)異常事件的不足,綜合考慮不同監(jiān)控場(chǎng)景下人群聚集的特點(diǎn),提供一種改進(jìn)型PCCNN神經(jīng)網(wǎng)絡(luò)模型的人群聚集檢測(cè)方法,采用多級(jí)神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)思路,實(shí)時(shí)分析視頻中人群的密度變化特征,從而實(shí)現(xiàn)檢測(cè)視頻中的人群聚集行為,主動(dòng)進(jìn)行群體事件、群體行為的預(yù)警,避免異常事件的發(fā)生以及可能造成的人員傷亡。
技術(shù)方案:本發(fā)明采用的技術(shù)方案為:
一種改進(jìn)型PCCNN神經(jīng)網(wǎng)絡(luò)模型的人群聚集檢測(cè)方法,包括以下步驟:
(1)收集不同遠(yuǎn)近視角下的人群聚集分段序列圖像并進(jìn)行擴(kuò)充后作為訓(xùn)練集,將訓(xùn)練集中的圖像根據(jù)與攝像機(jī)的距離分為離攝像機(jī)近的、離攝像機(jī)適中的以及離攝像機(jī)遠(yuǎn)的A、B、C三類,并向訓(xùn)練集中添加無(wú)人的D類背景圖像;
(2)構(gòu)建由三個(gè)深度不同的子神經(jīng)網(wǎng)絡(luò)組成的并行交叉神經(jīng)網(wǎng)絡(luò)模型,其中,第一個(gè)子網(wǎng)絡(luò)深度>第二個(gè)子網(wǎng)絡(luò)深度>第三個(gè)子網(wǎng)絡(luò)深度;
(3)分別以A、B、C類為正樣本,其余三類總和為負(fù)樣本依次訓(xùn)練第一個(gè)子網(wǎng)絡(luò)、第二子網(wǎng)絡(luò)、第三子網(wǎng)絡(luò)響應(yīng)的正樣本分類正確率達(dá)設(shè)定閾值以上,將得到的參數(shù)作為并行交叉神經(jīng)網(wǎng)絡(luò)模型中子網(wǎng)絡(luò)的初始訓(xùn)練參數(shù);在確定三個(gè)子網(wǎng)絡(luò)的初始訓(xùn)練參數(shù)后將ABCD四類圖片作為輸入對(duì)并行交叉神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,從而獲得最終的神經(jīng)網(wǎng)絡(luò)模型;
(4)用訓(xùn)練好的模型對(duì)目標(biāo)視頻的采樣幀進(jìn)行分析,得到相應(yīng)的密度圖;
(5)通過(guò)對(duì)密度圖分別進(jìn)行人群分布區(qū)域的提取和分布數(shù)量的估算,同時(shí)結(jié)合人群聚集加權(quán)中心矩的計(jì)算,從而判定是否存在人群聚集的行為。
作為優(yōu)選,步驟(1)中的擴(kuò)充包括將訓(xùn)練圖像以自身為基準(zhǔn)進(jìn)行指定倍數(shù)的放縮,以及選取訓(xùn)練圖像中的高密度部分兩種擴(kuò)充操作。
作為優(yōu)選,步驟(2)中的多深度的并行交叉神經(jīng)網(wǎng)絡(luò)模型中,第一個(gè)子網(wǎng)絡(luò)深度為5,之間穿插4個(gè)最大池化層,第二個(gè)子網(wǎng)絡(luò)深度為4,之間穿插2個(gè)最大池化層和2個(gè)平均池化層,第三個(gè)子網(wǎng)絡(luò)深度為3,之間穿插3個(gè)平均池化層;各子網(wǎng)絡(luò)的輸出末端輸入一個(gè)1*1的卷積層,該1*1的卷積層的輸出通過(guò)雙線性插值對(duì)輸入圖像采樣最終生成人群分布的密度圖。
作為優(yōu)選,步驟(5)中,包括:
(5.1)對(duì)密度圖進(jìn)行二值化,提取二值化圖像中的連通區(qū)域,計(jì)算各連通區(qū)域的面積占整幅圖像的百分比;
(5.2)對(duì)密度圖進(jìn)行中值濾波,將濾波后的各連通區(qū)域位置對(duì)應(yīng)的像素值求和,估算各區(qū)域人群分布數(shù)量;
(5.3)根據(jù)密度圖中各連通區(qū)域的密度分布求各區(qū)域的加權(quán)一階中心矩,確定各區(qū)域的聚集中心;
(5.4)當(dāng)連續(xù)采樣幀中的連通區(qū)域百分比占比大于設(shè)定閾值,對(duì)應(yīng)區(qū)域的人數(shù)分布數(shù)量估計(jì)大于設(shè)定閾值,且連續(xù)采樣幀的聚集中心在視頻幀中的偏移小于設(shè)定的范圍,則判定發(fā)生了人群聚集。
作為優(yōu)選,步驟(5.2)中每個(gè)區(qū)域人群分布數(shù)量的估算值采用對(duì)像素和值*b進(jìn)行線性估算,b為人數(shù)估計(jì)值和像素密度值固定映射比值。有益效果:本發(fā)明與現(xiàn)有技術(shù)方案相比,其顯著優(yōu)點(diǎn)為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)電子科技集團(tuán)公司第二十八研究所,未經(jīng)中國(guó)電子科技集團(tuán)公司第二十八研究所許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710564899.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置





