[發明專利]一種基于噪聲可知的全網絡監督目標檢測方法有效
| 申請號: | 202010300928.7 | 申請日: | 2020-04-16 |
| 公開(公告)號: | CN111523586B | 公開(公告)日: | 2022-09-06 |
| 發明(設計)人: | 紀榮嶸;沈云航 | 申請(專利權)人: | 廈門大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廈門市新華專利商標代理有限公司 35203 | 代理人: | 羅恒蘭 |
| 地址: | 361000 福建*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 噪聲 可知 網絡 監督 目標 檢測 方法 | ||
1.一種基于噪聲可知的全網絡監督目標檢測方法,其特征在于:包括
步驟1、構建全網絡監督目標檢測的網絡模型;
所述網絡模型包括主干卷積神經網絡、候選區域池化層、弱監督檢測頭部網絡和殘差檢測頭部網絡;所述主干卷積神經網絡的輸出端連接候選區域池化層的輸入端;所述候選區域池化層的輸出端連接弱監督檢測頭部網絡和殘差檢測頭部網絡;
步驟2、網絡模型訓練;
步驟2.1、初始化主干卷積神經網絡;
步驟2.2、給定類別,從圖像分享網站上抓取圖像數據作為圖像訓練集;
步驟2.3、從圖像訓練集中隨機采樣兩張類別標簽一樣的訓練圖像;
步驟2.4、把訓練圖像輸入模型,經主干卷積神經網絡和候選區域池化層后獲得候選區域特征圖;
步驟2.5、候選區域特征圖經弱監督檢測頭部網絡前向傳播獲得預測結果yk;候選區域特征圖經殘差檢測頭部網絡前向傳播獲得預測結果
步驟2.6、計算弱監督檢測頭部網絡預測結果的空間敏感熵值;
(1)計算每個預測結果的熵:
其中,表示第r個候選區域的第k個類別的弱監督檢測頭部的預測結果;
(2)計算候選區域之間的Jaccard相似系數矩陣
Jij=IoU(pi,pj)
其中,IoU(pi,pj)表示候選區域pi和候選區域pj的交并比;
(3)計算熵的正則項:
其中,表示Hadamard除法;
(4)計算加入空間信息修正后的熵:
其中,⊙表示Hadamard乘法;
(5)計算每個類別標簽是背景噪聲的置信度:
其中,pk表示第k個類別標簽是背景噪聲的置信度,tk表示第k個類別的標簽,zk表示第k個類別可能存在的最大的熵,ln()表示底數為自然數,e的對數函數,yk為預測結果;
步驟2.7、根據空間敏感熵的值計算網絡模型的最終損失;
(1)弱監督檢測頭部網絡的損失函數為:
(2)殘差檢測頭部網絡的損失函數為:
(3)網絡模型的最終損失函數為:
其中,C表示類別的數目;
步驟2.8、基于網絡模型的最終損失函數,使用隨機梯度下降算法更新主干卷積神經網絡的參數;
步驟2.9、重復步驟2.3-2.8直到交叉熵損失函數的結果不再降低;
步驟3、目標檢測;
步驟3.1、輸入一張圖像到網絡模型,經主干卷積神經網絡和弱監督檢測頭部網絡后得到預測結果yk。
2.根據權利要求1所述的一種基于噪聲可知的全網絡監督目標檢測方法,其特征在于:所述步驟2.3采樣得到的訓練圖像通過包混淆策略生成兩張新的訓練圖像,然后將新的訓練圖像輸入網絡模型中;包混淆策略具體為:
隨機采樣一張訓練圖像I1,根據采樣圖像I1的標簽再次采樣一張同標簽的訓練圖像I2;
隨機從Dirichlet分布里采樣混合率{λ1,λ2},生成兩張新的訓練圖像:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門大學,未經廈門大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010300928.7/1.html,轉載請聲明來源鉆瓜專利網。





