[發明專利]基于級聯注意力與點監督機制的全卷積考場目標檢測方法有效
| 申請號: | 202010672308.6 | 申請日: | 2020-07-14 |
| 公開(公告)號: | CN111814704B | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 馬苗;田卓鈺;郭敏;任杰 | 申請(專利權)人: | 陜西師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06T7/00;G06N3/04;G06N3/08 |
| 代理公司: | 西安永生專利代理有限責任公司 61201 | 代理人: | 申忠才 |
| 地址: | 710062 *** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 級聯 注意力 監督機制 卷積 考場 目標 檢測 方法 | ||
一種基于級聯注意力與點監督機制的全卷積考場目標檢測方法,由構建全卷積考場目標檢測網絡模型、訓練全卷積考場目標檢測網絡模型、檢測測試集圖像組成。本發明在FCOS方法的基礎上,提出了級聯注意力模塊,插入骨干網絡與特征金字塔網絡之間,使特征金字塔網絡獲得顯著的特征;在全卷積檢測頭部模塊增加了點監督分支,使檢測模型具有區分交疊目標能力,能在考生座位密集的考場監控場景下檢測交疊目標,解決了密集場景下目標檢測包圍框回歸不準確的問題。本發明精度為92.9%,檢測速度為22.1幀/秒,提高了考場目標檢測任務的精度與速度,可用于考場檢測。
技術領域
本發明屬于教育科學和圖像處理的交叉研究技術領域,具體地涉及到標準化考場中的考生目標檢測。
背景技術
考試是考核學習者知識水平和能力的主要途徑。為了規范考場秩序、防范考生作弊行為,維護考試的公平和公正,我國目前主要采用現場考官巡查與電子視頻監控相結合的方式進行監考。由于考場監控視頻的數據量龐大、冗余信息過多,傳統考場監控系統效率極低,監測人員往往會因勞動強度大而導致視覺疲勞,無法保證對多個考場監控畫面進行高效監測,難以發現考生的異常行為。運用先進的計算機視覺技術服務于現行的各類考試,建設智慧考場,實現考生行為的智能化監控,對于減輕監測人員的壓力、維護考場秩序和保證考試公平具有重要的現實意義。現有的考場智能化監測技術的研究較少,主要使用傳統的圖像處理技術監測異常情況,存在著準確率低、計算量大、速度慢等問題,無法滿足考場監測的現實需求。
基于深度學習的目標檢測技術可大致分為兩階段檢測方法與單階段檢測方法兩類。兩階段方法通常包括候選區域的生成及分類兩個步驟,但其速度往往過慢,難以實際應用。單階段方法利用卷積神經網絡對整幅圖像提取特征并直接預測回歸目標的類別與位置,提高了目標檢測的速度,但檢測精度不高。另外目前大多數方法采用基于先驗錨框的思想,不僅需要人工設計繁瑣的錨框參數,而且當結合多尺度架構時會變得十分復雜。雖然近年來在目標檢測領域出現了一些無錨框的目標檢測方法,避免了手工設計錨框的步驟,但未考慮針對標準化考場下考生目標分布相對密集且因考生就坐位置與成像設備間的距離導致成像尺寸差異大的情況。
目標檢測(FCOS)方法是一種基于全卷積網絡的逐像素目標檢測方法。該目標檢測方法先對輸入圖片進行特征提取,以特征圖中各個像素點為中心進行目標分類與包圍框回歸,FCOS方法由骨干網絡、特征金字塔模塊、全卷積檢測頭部三部分組成。骨干網絡通常采用殘差網絡進行特征提取,將提取得到的一系列特征圖輸入至特征金字塔模塊中進行多尺度特征融合,將不同尺度的特征圖輸入全卷積檢測頭部模塊進行目標的分類與回歸。全卷積檢測頭部模塊包含分類分支和回歸分支,其中分類分支包含分類得分圖和Center-ness熱力圖,回歸分支包含距離信息圖。
考慮到真實考場監控視頻中考生目標分布相對密集且因就坐位置與成像設備間的距離導致成像尺寸差異大,FCOS方法難以對其進行精確檢測。另外,在FCOS方法中若標注的真實框重疊,位置(x,y)映射到原圖中將得到多個真實框,則該位置被認為是模糊樣本,重疊的真實框可能會在訓練過程中造成難以處理的歧義。在教室監控場景下,目標分布密集,大多數目標會相互遮擋,僅使用FCOS方法中的多級預測和Center-ness方法難以確定檢測框的邊界,容易造成誤判。
發明內容
本發明所要解決的技術問題在于克服現有技術的缺點,提供一種方法能夠有效進行考場目標檢測的基于級聯注意力與點監督機制的全卷積考場目標檢測方法。
解決上述技術問題所采用的技術方案是由下述步驟組成:
(1)構建全卷積考場目標檢測網絡模型
在Pytorch框架下,將基于級聯注意力的特征增強模塊的特征提取網絡輸出與采用點監督分支的檢測模塊連接構成基于級聯注意力與點監督機制的全卷積考場目標檢測網絡模型。
(2)訓練全卷積考場目標檢測網絡模型
(a)設置網絡的超級參數
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陜西師范大學,未經陜西師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010672308.6/2.html,轉載請聲明來源鉆瓜專利網。





