[發(fā)明專利]基于強化學習與殘差分類網(wǎng)絡進行人群計數(shù)的方法在審
| 申請?zhí)枺?/td> | 202211380112.5 | 申請日: | 2022-11-05 |
| 公開(公告)號: | CN115761621A | 公開(公告)日: | 2023-03-07 |
| 發(fā)明(設(shè)計)人: | 郭文忠;蔣家淼;柯逍 | 申請(專利權(quán))人: | 福州大學 |
| 主分類號: | G06V20/52 | 分類號: | G06V20/52;G06V10/26;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 福州元創(chuàng)專利商標代理有限公司 35100 | 代理人: | 郭東亮;蔡學俊 |
| 地址: | 350108 福建省福州市*** | 國省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 強化 學習 分類 網(wǎng)絡 進行 人群 計數(shù) 方法 | ||
本發(fā)明提出基于強化學習與殘差分類網(wǎng)絡進行人群計數(shù)的方法,包括以下步驟:步驟S1:采用預設(shè)的函數(shù)將人的數(shù)量定義為多個類別,所述類別與人員數(shù)量范圍具有對應關(guān)系;步驟S2:拍攝密集人群場景,將原始圖像輸入至殘差分類卷積神經(jīng)網(wǎng)絡之中,訓練網(wǎng)絡,直至網(wǎng)絡權(quán)重穩(wěn)定,獲取該圖像所屬的特征圖和分塊分類結(jié)果,即類別圖;步驟S3:將圖像的特征圖與類別圖輸入至強化學習評估網(wǎng)絡之中,根據(jù)圖像特征對類別圖做出精確調(diào)整,獲取更細粒度的類別圖;步驟S4:將圖像的類別圖映射回人數(shù),獲取原圖像的計數(shù)圖,計數(shù)圖進行值累加獲取原攝影機所監(jiān)測場景圖像的預測人數(shù);本發(fā)明能夠更為精準地對人群中人的數(shù)量進行分類,根據(jù)分類結(jié)果得到人群的具體人數(shù)。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺技術(shù)領(lǐng)域,尤其是基于強化學習與殘差分類網(wǎng)絡進行人群計數(shù)的方法。
背景技術(shù)
人群計數(shù)即Crowd Counting,是計算機視覺中的一項關(guān)鍵任務,其目的是對圖像中的人進行計數(shù),在諸如旅游景點、大型集會等人群密集的場景中均需要對人群進行實時估計人數(shù),防范人群相互踩踏等安全事故的發(fā)生。目前學術(shù)界在人群計數(shù)問題上采用的主要方法是通過深度卷積神經(jīng)網(wǎng)絡(CNN)回歸密度圖,也就是將圖像中的人標記出來,形成一張全是標記點的密度圖,對密度圖進行求和即可得到原圖像的人數(shù)。但是由于這種方法存在著由于冗余特征干擾導致,以及當人被遮擋時無法標記等問題,這種方法在統(tǒng)計的精度上仍然有較大的提升空間。
隨著近年來深度卷積神經(jīng)網(wǎng)絡的發(fā)展,部分研究者將圖像分割的方法遷移到人群計數(shù)任務上,并取得了一定的效果。但是分塊分類方法在復雜場景中(例如UCF-CC-50數(shù)據(jù)集)的表現(xiàn)并不理想,因為復雜場景中,圖像內(nèi)包含了大量的冗余特征和干擾信息,用這些特征和信息來對圖像進行分塊分類會對最終的分類結(jié)果產(chǎn)生極大的影響。
發(fā)明內(nèi)容
本發(fā)明提出基于強化學習與殘差分類網(wǎng)絡進行人群計數(shù)的方法,能夠更為精準地對人群中人的數(shù)量進行分類,根據(jù)分類結(jié)果得到人群的具體人數(shù)。
本發(fā)明采用以下技術(shù)方案。
基于強化學習與殘差分類網(wǎng)絡進行人群計數(shù)的方法,包括以下步驟:
步驟S1:采用預設(shè)的函數(shù)將人的數(shù)量定義為多個類別,所述類別與人員數(shù)量范圍具有對應關(guān)系;
步驟S2:由攝影機實時拍攝各類易發(fā)生安全問題的密集人群場景,將原始圖像輸入至殘差分類卷積神經(jīng)網(wǎng)絡之中,以分塊分類損失函數(shù)訓練網(wǎng)絡,直至網(wǎng)絡權(quán)重穩(wěn)定,獲取該圖像所屬的特征圖和分塊分類結(jié)果,即類別圖;
步驟S3:將圖像的特征圖與類別圖輸入至強化學習評估網(wǎng)絡之中,由評估網(wǎng)絡根據(jù)圖像特征對類別圖做出精確調(diào)整,獲取更細粒度的類別圖;
步驟S4:采用預設(shè)的函數(shù)將圖像的類別圖映射回人數(shù),獲取原圖像的計數(shù)圖,計數(shù)圖進行值累加獲取原攝影機所監(jiān)測場景圖像的預測人數(shù)。
步驟S1具體包括以下步驟;
步驟S11:確定人數(shù)count屬于哪個類別,事先需要判斷count是否大于第index個類classindex的區(qū)間下限,第index個類別的區(qū)間下限由以下公式定義:
由上式可知,第1類的人數(shù)區(qū)間下限為0,第2類的人數(shù)區(qū)間下限為0.13,以此類推;若人數(shù)count大于第index類的人數(shù)區(qū)間下限,則繼續(xù)步驟S12;
步驟S12:將人數(shù)count與第index個類classindex的區(qū)間上限進行比較;第index個類別的區(qū)間上限由以下公式定義:
由上式可知,第1類的人數(shù)區(qū)間上限為0.13,第2類的人數(shù)區(qū)間上限為0.15,以此類推;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福州大學,未經(jīng)福州大學許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211380112.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





