[發(fā)明專利]一種目標檢測方法、裝置以及計算機可讀存儲介質有效
| 申請?zhí)枺?/td> | 202011285823.5 | 申請日: | 2020-11-17 |
| 公開(公告)號: | CN112101360B | 公開(公告)日: | 2021-04-27 |
| 發(fā)明(設計)人: | 胡來豐 | 申請(專利權)人: | 浙江大華技術股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06N3/04 |
| 代理公司: | 深圳市威世博知識產權代理事務所(普通合伙) 44280 | 代理人: | 黎堅怡 |
| 地址: | 310051 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 目標 檢測 方法 裝置 以及 計算機 可讀 存儲 介質 | ||
本申請公開了一種目標檢測方法、裝置以及計算機可讀存儲介質,該目標檢測方法包括:獲取待檢測圖像,并獲取待檢測圖像中目標的框特征;從預存的框緩存特征中提取與目標的類型對應的框緩存特征,其中,框緩存特征標識預測點與真實目標邊框的距離信息;基于目標的框特征以及框緩存特征計算目標最終目標框的位置和大小。上述方案,能夠提高目標檢測的準確性。
技術領域
本申請涉及圖像處理與人工智能技術領域,特別是涉及一種目標檢測方法、裝置以及計算機可讀存儲介質。
背景技術
隨著CNN的發(fā)展,出現(xiàn)了許多目標檢測算法。這些基于CNN的目標檢測算法雖然能夠達到很高的檢測精度,但都需要依靠大量物體級標記(對每個目標畫出目標框)的樣本進行訓練上的支持。并且,對于不同的檢測任務,需要構建完全不同的數(shù)據(jù)庫進行訓練。在實際應用中,獲取大量的訓練樣本有時需要耗費大量的人力和時間成本,有時則是完全無法達到的。這已經成了應用基于CNN的目標檢測算法的瓶頸。
為了解決物體級標記難以獲得的問題,基于弱監(jiān)督學習的目標檢測算法應運而生。這類算法同樣基于CNN,但不同的是在訓練過程中不再使用物體級的標簽,而是使用圖像級標簽(只對圖像內是否存在目標進行標注)。一方面,在進行人工標注時,進行圖像級標注的難度遠遠低于物體級標注,能夠以更高的效率構建訓練數(shù)據(jù)集。另一方面,由于搜索引擎的存在,人們甚至可以輕而易舉地通過網絡獲取帶有特定圖像級標注的樣本,進一步削減了構建數(shù)據(jù)集的工作量。
然而,在現(xiàn)有的深度學習目標檢測技術下,其首先需要在大量的人工精細標注(類別及位置)的數(shù)據(jù)上進行神經網絡的訓練才能得到更高精度的網絡模型,人工標注費耗人力,怎么樣在稀疏的標注下得到更優(yōu)的網絡模型成為技術瓶頸。
發(fā)明內容
本申請至少提供一種目標檢測方法、裝置以及計算機可讀存儲介質。
本申請第一方面提供了一種目標檢測方法,所述目標檢測方法包括:
獲取待檢測圖像,并獲取所述待檢測圖像中目標的框特征;
從預存的框緩存特征中提取與所述目標的類型對應的框緩存特征,其中,所述框緩存特征標識預測點與真實目標邊框的距離信息;
基于所述目標的框特征以及所述框緩存特征計算所述目標最終目標框的位置和大小。
其中,所述方法還包括:
獲取多張待訓練圖像,將多張所述待訓練圖像輸入預設神經網絡進行訓練,得到所述待訓練圖像的預測點;
基于所述預測點以及標注的真實目標邊框,得到框特征;
對多張所述待訓練圖像的框特征進行更新,得到所述框緩存特征。
其中,所述對多張所述待訓練圖像的框特征進行更新,得到框緩存特征的步驟,包括:
獲取上一張待訓練圖像的框特征,以及當前張待訓練圖像的框特征;
將所述上一張待訓練圖像的框特征和所述當前張待訓練圖像的框特征按照第一預設更新權重疊加,得到所述框緩存特征。
其中,所述從預存的框緩存特征中提取與所述目標的類型對應的框緩存特征之前,所述方法還包括:
基于預存的類緩存特征、所述目標的類特征以及所述目標的第一分類置信度計算所述目標的第二分類置信度;
基于所述第二分類置信度確定所述目標的類型。
其中,所述方法還包括:
基于所述目標的框特征計算所述目標的中心度;
獲取所述目標參考所述中心度后的分類置信度作為所述第一分類置信度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大華技術股份有限公司,未經浙江大華技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011285823.5/2.html,轉載請聲明來源鉆瓜專利網。





