[發明專利]神經網絡訓練方法以及通用物體檢測方法、裝置和系統有效
| 申請號: | 201711161464.0 | 申請日: | 2017-11-20 |
| 公開(公告)號: | CN108875901B | 公開(公告)日: | 2021-03-23 |
| 發明(設計)人: | 肖特特 | 申請(專利權)人: | 北京曠視科技有限公司;北京邁格威科技有限公司 |
| 主分類號: | G06N3/04 | 分類號: | G06N3/04;G06K9/62 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 蘇勝 |
| 地址: | 100000 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 神經網絡 訓練 方法 以及 通用 物體 檢測 裝置 系統 | ||
本發明提供了一種神經網絡訓練方法以及通用物體檢測方法、裝置和系統,涉及檢測技術領域,應用于通用物體檢測,該神經網絡訓練方法包括:對輸入圖片進行卷積處理,獲得輸入圖片的特征圖,對特征圖進行至少兩次卷積處理,利用至少兩個分類器,對每次卷積處理后的中間特征圖分別進行通用物體檢測,獲得至少兩個檢測結果,將至少兩個檢測結果進行合并,獲得最終檢測結果,根據最終檢測結果對一個或多個分類器進行反傳損失,更新一個或多個分類器中的參數,解決了現有技術中采用卷積神經網絡會導致精度不高的問題,在保證計算效率的同時,能夠減少誤報率,進而提升了檢測精度。
技術領域
本發明涉及圖像檢測技術領域,尤其是涉及一種神經網絡訓練方法以及一種通用物體檢測方法、裝置和系統。
背景技術
神經網絡是一種大規模、多參數優化的工具。依靠大量的訓練數據,神經網絡能夠學習出數據中難以總結的隱藏特征,從而完成多項復雜的任務,例如,人臉檢測,圖片分類,物體檢測,動作追蹤,自然語言翻譯等,總之,神經網絡已被人工智能界廣泛應用。而相較于人臉檢測或行人檢測等特定類別物體的檢測,通用物體檢測是檢測領域最為泛化的問題。原因在于,通用物體檢測所面向目標的類別更多(可能達幾十類或數百類),更難獲得準確定位。
發明內容
有鑒于此,本發明的目的在于提供神經網絡訓練方法以及通用物體檢測方法、裝置和系統,以降低通用物體檢測過程中的誤報率。
第一方面,本發明實施例提供了一種神經網絡訓練方法,神經網絡用于通用物體檢測;
方法包括:
對輸入圖片進行卷積處理,獲得輸入圖片的特征圖;
對特征圖進行至少兩次卷積處理,利用至少兩個分類器,對每次卷積處理后的中間特征圖分別進行卷積檢測處理,獲得至少兩個檢測結果;
將至少兩個檢測結果進行合并,獲得最終檢測結果;
根據最終檢測結果對一個或多個分類器進行反傳損失,更新一個或多個分類器中的參數。
結合第一方面,本發明實施例提供了第一方面的第一種可能的實施方式,其中,對特征圖進行至少兩次卷積處理,利用至少兩個分類器,對每次卷積處理后的中間特征圖分別進行卷積檢測處理,獲得至少兩個檢測結果中間特征圖,具體包括:
將特征圖劃分為多個區塊;
對特征圖進行至少兩次卷積處理;
利用至少兩個分類器,對每次卷積處理后的中間特征圖分別進行卷積檢測處理,獲得每個區塊的至少兩個檢測結果。
結合第一方面的第一種可能的實施方式,本發明實施例提供了第一方面的第二種可能的實施方式,其中,將至少兩個檢測結果進行合并,獲得最終檢測結果,具體包括:
對于每個區塊,若該區塊的每個檢測結果均為被接受,則該區塊的最終檢測結果為被接受;
若該區塊的至少一個檢測結果為被拒絕,則該區塊的最終檢測結果為被拒絕。
結合第一方面的第二種可能的實施方式,本發明實施例提供了第一方面的第三種可能的實施方式,其中,根據最終檢測結果對一個或多個分類器進行反傳損失,更新一個或多個所述分類器中的參數,具體包括:
對于每個區塊,將該區塊的最終檢測結果與該區塊的真實結果進行比較,獲得該區塊的比較結果;
根據該區塊的比較結果對一個或多個分類器進行反傳損失,更新一個或多個分類器中的參數。
結合第一方面的第三種可能的實施方式,本發明實施例提供了第一方面的第四種可能的實施方式,其中,根據該區塊的比較結果對一個或多個分類器進行反傳損失,更新一個或多個所述分類器中的參數,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京曠視科技有限公司;北京邁格威科技有限公司,未經北京曠視科技有限公司;北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711161464.0/2.html,轉載請聲明來源鉆瓜專利網。





