[發明專利]一種基于注意力機制的墻面缺陷檢測方法有效
| 申請號: | 202010020128.X | 申請日: | 2020-01-09 |
| 公開(公告)號: | CN111191739B | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 蔡菥;葛樹志 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/82;G06N3/04;G06N3/08;G01N21/88 |
| 代理公司: | 北京正華智誠專利代理事務所(普通合伙) 11870 | 代理人: | 楊浩林 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 注意力 機制 墻面 缺陷 檢測 方法 | ||
本發明公開了一種基于注意力機制的墻面缺陷檢測方法,涉及計算機視覺技術領域,該方法通過加載已訓練完成的注意力網絡模型,在本檢測訓練過程中,僅需重新訓練較淺的幾層記憶力與分類網絡模型即可完成墻面缺陷檢測任務,因此訓練的計算量非常小,訓練速度快,大大降低了時間成本,可在存儲空間與計算資源有限的移動平臺上使用,即使移動平臺的計算能力也能達到實時檢測分類;通過使用長短時記憶網絡與全連接網絡結合的方式進行缺陷的類別預測,網絡保存了墻面缺陷的特征信息,即使在新場景不訓練使用也能達到較高的精確度,優于其余由于參數量過大造成過擬合的超深度神經網絡,因此可遷移性強。
技術領域
本發明涉及計算機視覺技術領域,具體而言,涉及一種基于注意力機制的墻面缺陷檢測方法。
背景技術
經典的目標檢測算法包括R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN到Mask R-CNN系列與YOLO、SSD、YOLO v2系列等。傳統的目標檢測算法通過滑動窗口來產生目標區域,每滑動一次進行一次檢測(分類),在窗口滑動步長不大時,相鄰的窗口重疊率高,并且一張圖片產生的窗口數量巨大,檢測的速度十分緩慢,直至R-CNN的提出。R-CNN使用了一種選擇性搜索(Selective Search,SS)辦法,先生成候選區域再檢測,降低了信息的冗余度,顯著提高了檢測的速度。R-CNN成功的引入了CNN卷積神經網絡來進行特征提取,但是存在一個問題,就是對輸入的圖像大小有嚴格的限制。面對這種問題,R-CNN對分割出來的2000多個候選區域進行切割或者放縮形變處理到固定大小,這樣雖然滿足了卷積神經網絡模型中全連接神經網絡對維度的要求,卻造成了圖片的信息丟失(切割)或者變性(放縮處理),會降低圖像識別的準確率。何凱明等在R-CNN模型的基礎上,提出了SPP-Net,他們不再于輸入網絡之前對圖像進行大小處理,而是直接將圖片輸入卷積神經網絡,然后對特征圖進一步處理,拼湊成和神經元個數相同的特征數,具體的方法是采用了金字塔池化層這一影響深遠的思路。SPP-Net的論文中使用三層的金字塔池化層,分別輸出1、4、16維度的特征,表征了將圖片切割成為多少塊,然后將特征拼接成為21x256維的特征輸入到全連接層,進行權重計算。SPP-Net是R-CNN的檢測速度的38倍,有效的解決了候選區域計算冗余的問題,但是依然存在一些缺陷:首先,其訓練仍然是多階段的;其次,SPP-Net在微調網絡時,只對全連接層進行了微調,影響了特征的準確性。而后續提出的Fast R-CNN模型進一步的解決了這些問題。Fast R-CNN最大的特點在于實現了一種多任務學習方式,實現了在網絡微調的同時,對目標分類和區域框回歸的同時訓練,且訓練速度是R-CNN的9倍,檢測速度是R-CNN的200倍。在VOC2007數據集上,Fast R-CNN將mAP由R-CNN的58.5%提升到了70%,優化了20%。Fast R-CNN成功的結合了R-CNN和SPP-Net兩者的優點,但還是需要事先使用外部算法來提取目標后選框,不能夠實現端到端的處理。后續提出的Faster R-CNN模型成功的解決了這個問題,成功的將候選區域檢測這一操作也交給網絡去完成。Faster R-CNN是第一個真正意義上的端到端的深度學習檢測算法,也是第一個準實時(17幀/秒,輸入圖片像素為640x480)的深度學習目標檢測算法。Faster R-CNN在VOC2007上再次將mAP由70%提升至78%,又提升了大于10%。Faster R-CNN的最大創新點在于設計了候選區域生成網絡(RegionProposal Network,RPN),并在其中設計了“多參考窗口”的機制,將SelectiveSearch等外部Object Proposal檢測算法融合到同一個深度網絡中實現。從R-CNN到SPP-Net到Fast R-CNN再到Faster R-CNN甚至到現在的MASK R-CNN,候選區域生成,特征提取,候選目標確認和區域框坐標回歸逐漸被統一到同一個網絡框架之中。
但是目前的目標檢測算法存在幾個顯著的缺點:
一、訓練時十分依賴目標框的標記,而制作數據集時對目標框的標記工作十分繁瑣并且容易產生誤差,在墻面缺陷檢測任務中,由于無現成數據集,需要新標記數據集,如果使用傳統的精確標記方法,工作量大且繁瑣易出錯。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010020128.X/2.html,轉載請聲明來源鉆瓜專利網。





