[發明專利]一種基于豪斯多夫距離計算距離損失的方法及裝置有效
| 申請號: | 202211243593.5 | 申請日: | 2022-10-12 |
| 公開(公告)號: | CN115330759B | 公開(公告)日: | 2023-03-10 |
| 發明(設計)人: | 張曉武;陳斌;李偉;徐朝彬 | 申請(專利權)人: | 浙江霖研精密科技有限公司 |
| 主分類號: | G06T7/00 | 分類號: | G06T7/00;G06V10/774;G06V10/80;G06V10/82 |
| 代理公司: | 成都君合集專利代理事務所(普通合伙) 51228 | 代理人: | 張鳴潔 |
| 地址: | 313000 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 豪斯多夫 距離 計算 損失 方法 裝置 | ||
1.一種基于豪斯多夫距離計算距離損失的方法,其特征在于,包括:
步驟S1,構建基于豪斯多夫距離的網絡模型,所述網絡模型包括從前到后依次連接的基于通道注意力模塊的ShuffleNetV2網絡、RepBlockv2模塊和基于豪斯多夫距離設計的無錨點檢測頭網絡;
步驟S2,將待測工業產品的數據集和訓練集輸入到基于通道注意力模塊的ShuffleNetV2網絡獲取不同尺寸的提取特征圖;
步驟S3,將所述提取特征圖輸入到RepBlockv2模塊,使用多分支結構配合深度可分離卷積和殘差連接,進行多級預測獲取融合特征圖;
步驟S4,將所述融合特征圖輸入到基于豪斯多夫距離設計的無錨點檢測頭網絡獲取檢測特征圖,并計算預測檢測框和真實框的距離損失,根據所述距離損失對所述基于豪斯多夫距離的網絡模型進行訓練,把檢測特征圖的每個位置作為訓練樣本,對于檢測特征圖中的每個位置對應原圖的邊框都進行邊界平滑的回歸,最終使用訓練后的基于豪斯多夫距離的網絡模型檢測待測工業產品;
所述步驟S1中基于通道注意力模塊的ShuffleNetV2網絡包括:
所述ShuffleNetV2網絡包括從前至后依次設置的卷積層、批標準化層、激活函數層以及若干個ShuffleNet基本單元,并去掉了最后一層卷積,抽取8、16、32倍下采樣的特征對工業產品數據集的訓練集進行多尺度的特征融合,獲取不同尺寸的提取特征圖;
所述ShuffleNet基本單元包括從前至后依次設置的卷積層、深度可分離卷積層和特征相加層,去掉了通道隨機混合操作模塊,設計了通道注意力模塊代替;
所述通道注意力模塊包括從前至后依次設置的自適應平均池化層、卷積層、ReLU激活函數、批標準化層和Hard-Sigmoid激活函數;
所述Hard-Sigmoid激活函數表示為:,其中,x為神經元的輸出。
2.根據權利要求1所述的一種基于豪斯多夫距離計算距離損失的方法,其特征在于,所述步驟S1中RepBlockv2模塊包括:
所述RepBlockv2模塊包括從前至后依次設置的卷積層、深度可分離卷積層、批標準化層、特征相加層和ReLU激活函數;
所述RepBlockv2模塊中的上采樣和下采樣均使用插值完成,并且將多尺寸的提取特征圖直接相加。
3.根據權利要求1所述的一種基于豪斯多夫距離計算距離損失的方法,其特征在于,所述步驟S1中基于豪斯多夫距離設計的無錨點檢測頭網絡包括:
基于豪斯多夫距離設計的無錨點檢測頭網絡檢測的待測工業產品檢測特征圖和多層特征圖集中各圖之間的誤差的方法包括類別分類損失函數和位置回歸函數:
所述類別分類損失函數采用焦點損失函數,所述的位置回歸函數采用雙向豪斯多夫距離損失函數和平滑L1損失函數;
所述雙向豪斯多夫距離表示為:
其中,B和G分別代表預測檢測框和真實框的二維高斯分布,b和g分別為分布中的點集,然后采用非線性轉換函數f將雙向豪斯多夫距離映射為類似IoU損失的函數,所以豪斯多夫損失函數表示為:
;
最終總損失函數表示如下:
;
其中,n為預測檢測框的個數,為預測檢測框,為真實框,為預測檢測框的標簽,為真實框的標簽,和為超參數,為焦點損失。
4.一種基于豪斯多夫距離計算距離損失的裝置,其特征在于,包括采集模塊、訓練模塊和檢測模塊: 所述采集模塊用于采集待測工業產品上的工業產品圖像樣本作為工業產品數據集,并將工業產品數據集分為測試集和訓練集;
所述訓練模塊中引入訓練豪斯多夫模塊,用于采集訓練基于豪斯多夫距離的網絡模型,所述基于豪斯多夫距離的網絡模型包括從前到后依次連接的基于通道注意力模塊的ShuffleNetV2網絡、RepBlockv2模塊和基于豪斯多夫距離設計的無錨點檢測頭網絡;
所述檢測模塊用于使用訓練后的基于豪斯多夫距離的網絡模型檢測待測工業產品;
所述ShuffleNetV2網絡包括從前至后依次設置的卷積層、批標準化層、激活函數層以及若干個ShuffleNet基本單元,并去掉了最后一層卷積,抽取8、16、32倍下采樣的特征對工業產品數據集的訓練集進行多尺度的特征融合,獲取不同尺寸的提取特征圖;
所述ShuffleNet基本單元包括從前至后依次設置的卷積層、深度可分離卷積層和特征相加層,去掉了通道隨機混合操作模塊,設計了通道注意力模塊代替;
所述通道注意力模塊包括從前至后依次設置的自適應平均池化層、卷積層、ReLU激活函數、批標準化層和Hard-Sigmoid激活函數;
所述Hard-Sigmoid激活函數表示為: ,其中,x為神經元的輸出。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江霖研精密科技有限公司,未經浙江霖研精密科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211243593.5/1.html,轉載請聲明來源鉆瓜專利網。





