[發明專利]一種基于多尺度特征解碼的圖像輪廓檢測方法有效
| 申請號: | 201810575641.8 | 申請日: | 2018-06-06 |
| 公開(公告)號: | CN109035251B | 公開(公告)日: | 2022-05-27 |
| 發明(設計)人: | 范影樂;張明琦;武薇;蔣涯 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06T7/10 | 分類號: | G06T7/10;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 尺度 特征 解碼 圖像 輪廓 檢測 方法 | ||
本發明涉及一種基于多尺度特征解碼的圖像輪廓檢測方法。針對傳統檢測方法對輪廓細節檢測的不精確問題,構造一種多尺度特征解碼模型,以提高輪廓定位的準確性,并實現輪廓像素點的精細化。首先構建特征提取模塊提取圖像多尺度特征,該模塊由四組基本單元串聯構成,每組基本單元包括兩個卷積層和一個下采樣層的串聯結構,因此特征提取模塊可以提取四個不同尺度的特征信息。然后搭建多尺度特征解碼模塊,通過逐步融合相鄰特征層之間的信息來挖掘各個尺度特征之間的差異和聯系,從而達到精確定位圖像輪廓的目的。
技術領域
本發明屬于機器學習與視覺理解領域,涉及一種基于多尺度特征解碼的圖像輪廓檢測方法。
背景技術
輪廓檢測的目的在于提取圖像中顯著的邊緣信息以及物體的主體輪廓,快速準確地提取圖像的輪廓細節,對于后續圖像理解以及高級視覺任務,例如目標檢測和圖像分割等有重要的意義。傳統輪廓檢測方法著重于提取圖像局部的光強、對比度、顏色和梯度信息,或者手工設計不同形狀的邊緣特征塊,并采用分類器對輪廓及非輪廓像素點進行分類。但是它們大都忽略了輪廓在整體層面上的意義,因此容易將噪聲或背景紋理判斷為輪廓信息,抑制效果較差,在檢測的準確性方面來說,很難滿足實際應用的需求。
近年來,隨著深度學習的迅速發展,深度卷積神經網絡憑借其強大的特征提取以及對抽象信息的表達能力,在計算機視覺方向得到了廣泛的應用。在輪廓檢測領域,卷積神經網絡從初級的邊緣信息逐漸過渡到高級的抽象語義信息,從圖像的局部細節過渡到整體的輪廓,改善了傳統方法所存在的特征表達不完整性,在檢測性能上有了較大的提高。但同時也存在著如下問題:(1)基于深度學習的輪廓檢測任務由于輸入圖像需要經過大量的卷積層以及全連接層網絡,因此在檢測速度方面并不理想。(2)輪廓檢測結果通常是由網絡的最后一層輸出得到,而忽略了中間卷積層的特征信息,導致檢測到的主體輪廓較粗,局部模糊。事實上上述被忽略的特征包含了豐富的圖像初級邊緣信息以及高級語義信息,充分利用這些特征將有助于提高輪廓檢測的準確性。(3)輸入圖像在卷積層中利用下采樣去除信息的冗余度,但在上采樣恢復圖像尺寸的過程會出現輪廓定位不準確的問題。
發明內容
為解決上述存在的問題,本發明提出了一種基于多尺度特征解碼的圖像輪廓檢測方法,該模型由特征提取模塊和多尺度特征解碼模塊兩部分組成。首先針對訓練圖像(每張圖像都對應于一張相同尺寸的二值標簽圖),構建一個特征提取模塊用于提取圖像多尺度特征,然后構建一個多尺度特征解碼模塊,通過挖掘初級邊緣信息和高級語義信息之間的差異和聯系來細化檢測輪廓,獲得訓練模型。最后對測試圖像做N個尺度的變換,分別送入訓練模型進行處理,并融合各個尺度的輸出,獲得輪廓檢測結果。
具體包括以下步驟:
步驟(1)構建特征提取模塊用于提取圖像多尺度特征;
特征提取模塊由八個卷積層和四個下采樣層串聯組成。每兩個卷積層和一個下采樣層構成一個特征提取基本單元,共有4個特征提取基本單元,因此圖像經過特征提取模塊后能得到一組多尺度特征F1,F2,F3,F4。
步驟(2)將特征提取模塊的輸出作用于損失層;
利用1×1-1卷積將特征提取模塊最后一層的多尺度特征F4轉變為單通道特征圖然后經過sigmod函數激活后,與對應訓練圖像的已知標簽進行損失運算,結果記為loss1。
步驟(3)構建多尺度特征解碼模塊;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810575641.8/2.html,轉載請聲明來源鉆瓜專利網。





