[發明專利]目標對象的檢測方法及裝置在審
| 申請號: | 201710986009.8 | 申請日: | 2017-10-20 |
| 公開(公告)號: | CN107748867A | 公開(公告)日: | 2018-03-02 |
| 發明(設計)人: | 陳志軍 | 申請(專利權)人: | 北京小米移動軟件有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04 |
| 代理公司: | 北京格羅巴爾知識產權代理事務所(普通合伙)11406 | 代理人: | 孫德崇 |
| 地址: | 100085 北京市海淀區清河*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 目標 對象 檢測 方法 裝置 | ||
技術領域
本公開涉及目標檢測領域,尤其涉及一種目標對象的檢測方法及裝置。
背景技術
相關技術中,采用Cascade CNN模型進行人臉檢測時,采用滑動窗口的方法,來查找人臉。當滑動的次數增多或窗口變大時,跟蹤過程所需的存儲空間會極具上升。由于相鄰的滑動窗口之間會產生重疊區域。因此,在檢測過程中做了大量的無用功,檢測速度慢。
發明內容
為克服相關技術中存在的問題,本公開提供一種目標對象的檢測方法及裝置。
根據本公開實施例的第一方面,提供一種目標對象的檢測方法,包括:
識別步驟,將待處理圖像輸入級聯的全卷積網絡FCN模型的第n層,識別得到所檢測的目標對象在所述第n層對應的概率圖,所述級聯的FCN模型包括L層FCN,L為大于或等于2的整數,所述n為從1到L的整數;
包圍盒確定步驟,根據所述第n層對應的概率圖上各概率值,得到各包圍盒,并采用非極大值抑制NMS將各包圍盒進行合并;
原圖區域確定步驟,將合并后的包圍盒在所述待處理圖像上得到對應的原圖區域;將所得到的所述原圖區域輸入所述級聯的FCN模型的第n+1層,迭代地執行所述識別步驟、所述包圍盒確定步驟和所述原圖區域確定步驟;直至在所述級聯的FCN模型的第L層,輸出所述目標對象在所述待處理圖像的位置。
在一種可能的實現方式中,該方法還包括:
針對所述目標對象進行訓練,得到級聯的卷積神經網絡CNN模型,所述級聯的CNN模型包括多層CNN;
將所述級聯的CNN模型轉化為所述級聯的FCN模型,所述級聯的FCN模型包括多層FCN。
在一種可能的實現方式中,該方法還包括:
將所述待處理圖像按照不同比例縮放,得到多個縮放后的圖像;
將所述多個縮放后的圖像輸入所述級聯的FCN模型,迭代地執行識別步驟、包圍盒確定步驟和原圖區域確定步驟,得到所述目標對象在所述多個縮放后的圖像中對應的位置;
采用NMS對識別出的所述多個縮放后的圖像中的位置進行聚合,得到所述目標對象在所述待處理圖像的位置。
在一種可能的實現方式中,將所述多個縮放后的圖像輸入所述級聯的FCN模型,迭代地執行識別步驟、包圍盒確定步驟和原圖區域確定步驟,得到所述目標對象在所述多個縮放后的圖像中對應的位置,包括:
所述識別步驟包括:將尺度為M*N的圖像輸入所述級聯的FCN模型的第n層,識別得到所述第n層對應的X*Y的概率圖,所述尺度為M*N的圖像由所述待處理圖像縮放得到的圖像,所述X等于M*St,Y等于N*St,所述St為步長,所述n為從1到L的整數;
所述包圍盒確定步驟包括:根據第n層對應的概率圖上的概率值大于設定閾值的點,得到S個包圍盒B,并采用NMS將S個包圍盒B進行合并;
所述原圖區域確定步驟包括:將合并后的S個包圍盒在所述尺度為M*M的圖像上得到對應的S個原圖區域B1;將所得到的S個原圖區域B1輸入所述級聯的FCN模型的第n+1層,迭代地執行所述識別步驟、所述包圍盒確定步驟和所述原圖區域確定步驟,直至在所述級聯的FCN模型的第L層,輸出所述目標對象在所述尺度為M*M的圖像中對應的概率圖和位置。
根據本公開實施例的第二方面,提供一種目標對象的檢測裝置,包括:
識別模塊,用于將待處理圖像輸入級聯的全卷積網絡FCN模型的第n層,識別得到所檢測的目標對象在所述第n層對應的概率圖,所述級聯的FCN模型包括L層FCN,L為大于或等于2的整數,所述n為從1到L的整數;
包圍盒確定模塊,用于根據所述第n層對應的概率圖上各概率值,得到各包圍盒,并采用非極大值抑制NMS將各包圍盒進行合并;
原圖區域確定模塊,用于將合并后的包圍盒在所述待處理圖像上得到對應的原圖區域;
迭代模塊,用于將所得到的所述原圖區域輸入所述級聯的FCN模型的第n+1層,控制所述識別模塊、所述包圍盒確定模塊和所述原圖區域確定模塊迭代地執行動作,直至在所述級聯的FCN模型的第L層,輸出所述目標對象在所述待處理圖像的位置。
在一種可能的實現方式中,該裝置還包括:
訓練模塊,用于針對所述目標對象進行訓練,得到級聯的卷積神經網絡CNN模型,所述級聯的CNN模型包括多層CNN;
轉化模塊,用于將所述級聯的CNN模型轉化為所述級聯的FCN模型,所述級聯的FCN模型包括多層FCN。
在一種可能的實現方式中,該裝置還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京小米移動軟件有限公司,未經北京小米移動軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710986009.8/2.html,轉載請聲明來源鉆瓜專利網。





