[發明專利]用編碼向量的行人圖像檢測自適應非極大值抑制處理方法有效
| 申請號: | 201910936327.2 | 申請日: | 2019-09-29 |
| 公開(公告)號: | CN110909591B | 公開(公告)日: | 2022-06-10 |
| 發明(設計)人: | 朱建科;張加良;楊雨 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06V40/10 | 分類號: | G06V40/10;G06V10/46;G06V10/774;G06K9/62 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 編碼 向量 行人 圖像 檢測 自適應 極大值 抑制 處理 方法 | ||
本發明公開了一種用編碼向量的行人圖像檢測自適應非極大值抑制處理方法。行人圖像進行特征提取,獲得多幅特征圖,特征圖中包含有身份信息和密度信息,進而通過網絡模型處理獲得候選檢測框;針對所有候選檢測框利用多幅特征圖采用非極大值抑制算法進行迭代處理,優化獲得行人目標的檢測框作為檢測結果。本發明方法通過神經網絡模型學習檢測框編碼向量,具備表達行人檢測框的密度信息與身份信息的能力,有效地解決了在行人檢測中顯著的行人相互遮擋問題。
技術領域
本發明涉及計算機視覺目標檢測領域,設計了一種基于編碼向量加入圖像行人檢測框密度信息和身份信息的行人圖像檢測自適應非極大值抑制算法
背景技術
行人檢測是計算機視覺領域的一個重要分支,在自動駕駛、智能視頻監控、智能機器人等領域有著重要的應用。由于行人姿態、體型、穿著的變化,自然場景下光線、環境的變化以及部分遮擋的問題使得行人檢測仍舊是一個挑戰。
行人檢測作為目標檢測的一個特定任務,其發展歷程與目標檢測具有一致性。一般地,可以將目標檢測分為基于錨點的方法和最新的無錨點的檢測方法。其中基于錨點的方法,如Faster-RCNN、SSD以及它們的變形在過去幾年中占有主導地位;而無錨點的方法,如ComerNet、CenterNet、CSP展現了它們不錯的結果以及靈活的結構設計。的探測器是基于無錨點的方法。
行人檢測無錨點的算法思想是通過深度學習提取具有高級語義的特征。具體地,將行人檢測中行人的中心點坐標和檢測框的尺度(寬和高)作為高級語義特征,那么行人檢測就完全可以轉化為這些語義特征的檢測。對于一張輸入的圖像,經過卷積神經網絡分成中心點特征圖和尺度特征圖,計算得到中心點的坐標和檢測框的尺度,即可檢測出行人。
作為目標檢測的特定任務,行人檢測具有自身的特點,其中人群的遮擋問題是重要挑戰之一。在最新的行人檢測數據集CrowdHuman中,人群的密集水平變得很高,以RFB-Net為骨干的基于密度信息的自適應非極大值算法在此數據集上進行行人檢測,丟失率從12.7%升高到了63.03%,可見擁擠環境下的行人檢測是一個關鍵問題。
為了解決這個問題,目前有以下幾種方法:1.采用恒定的非極大值抑制閾值,通過提出額外的損失來約束回歸目標,以產生更緊湊的檢測框,從而降低NMS 閾值的影響;2.采用軟非極大值抑制,對檢測框進行重新估分,對較差的框抑制其分數而不是直接過濾;3.采用自適應的非極大值抑制,通過一種估計檢測框密度的方法,來自適應地設置NMS算法的閾值。
然而這些算法仍未能很好地解決擁擠環境下的行人檢測問題,準確率仍有較大的提升空間。
發明內容
為了解決背景技術中存在的問題,本發明基于無錨點的行人檢測算法,在 CSP(Centerand Scale Prediction)的基礎上擴展了一個身份-密度分支,并提出了一種針對檢測框抑制的自適應非極大值抑制算法,是一種結合考慮行人檢測框的密度信息與身份信息的自適應非極大值抑制算法。
如圖1所示,本發明采用的技術方案具體步驟如下:
1)行人圖像進行特征提取,獲得多幅特征圖,一幅特征圖中包含有身份信息和密度信息,進而通過網絡模型處理獲得候選檢測框;
2)針對所有候選檢測框利用多幅特征圖采用非極大值抑制算法進行迭代處理,優化獲得行人目標的檢測框作為檢測結果。
本發明提出了的一種自適應的非極大值抑制算法,能夠根據檢測框的密度信息及檢測框之間的距離信息,自適應地計算非極大值抑制的閾值,從而對多余的檢測框進行抑制。
本發明進行檢測框的抑制可以盡可能地抑制同一對象上的不同檢測框,并保留不同對象上的檢測框,極大地提高了行人檢測的效果。
所述步驟1)具體分為兩個階段:
在模型訓練階段:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910936327.2/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





