[發明專利]一種基于多尺度特征解碼的圖像輪廓檢測方法有效
| 申請號: | 201810575641.8 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN109035251B | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 范影樂;張明琦;武薇;蔣涯 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 特征 解碼 圖像 輪廓 檢測 方法 | ||
1.一種基于多尺度特征解碼的圖像輪廓檢測方法,其特征在于,該方法具體包括以下步驟:
步驟(1)構建特征提取模塊用于提取圖像多尺度特征;
特征提取模塊由八個卷積層和四個下采樣層串聯組成;每兩個卷積層和一個下采樣層構成一個特征提取基本單元,共有4個特征提取基本單元,因此圖像經過特征提取模塊后能得到一組多尺度特征F1,F2,F3,F4;
步驟(2)將特征提取模塊的輸出作用于損失層;
利用1×1-1卷積將特征提取模塊最后一層的多尺度特征F4轉變為單通道特征圖然后經過sigmod函數激活后,與對應訓練圖像的已知標簽進行損失運算,結果記為loss1;
步驟(3)構建多尺度特征解碼模塊;
將步驟(1)中的多尺度特征F1,F2,F3,F4送入特征解碼模塊;特征解碼模塊以金字塔形式從下往上搭建,首先通過線性插值法將特征F1,F2,F3,F4縮放到原圖像大小,并將其作為第一層特征對分別做卷積運算,得到然后將中相鄰的兩個特征,即F11和和和中位于同一位置的像素點相加起來,并對相加后的特征再做卷積運算,得到一組特征按上述方式循環搭建解碼模塊,直到獲得最后的單通道特征圖F14;
步驟(4)將特征解碼模塊的單通道特征F14經過sigmod函數激活后,與對應訓練圖像的已知標簽進行損失運算,結果記為loss2;將loss1和loss2按權重相加得到最后總損失值Loss,根據總損失值Loss對模型進行反向傳播,利用梯度下降法迭代更新整個模型的權重和偏置,使其收斂,獲得訓練模型;
步驟(5)對測試圖像進行4個尺度變換,將變換結果分別輸入步驟(4)獲得的訓練模型,在特征解碼模塊中輸出每個尺度下的輪廓響應,然后將輪廓響應插值恢復到與原圖一致的尺寸,并進行融合運算,最后得到輪廓的檢測結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810575641.8/1.html,轉載請聲明來源鉆瓜專利網。





