[發明專利]基于VGG16-SegUnet和dropout的海流機葉片附著物識別方法有效
| 申請號: | 201911132810.1 | 申請日: | 2019-11-19 |
| 公開(公告)號: | CN110863935B | 公開(公告)日: | 2020-09-22 |
| 發明(設計)人: | 彭海洋;王天真 | 申請(專利權)人: | 上海海事大學 |
| 主分類號: | F03B11/00 | 分類號: | F03B11/00;F03B13/00;G06K9/00;G06K9/34;G06K9/62 |
| 代理公司: | 上海互順專利代理事務所(普通合伙) 31332 | 代理人: | 成秋麗 |
| 地址: | 201306 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 vgg16 segunet dropout 海流 葉片 附著物 識別 方法 | ||
1.一種基于VGG16-SegUnet和dropout的海流機葉片附著物識別方法,其特征在于,包括以下步驟:
步驟一、首先,采集不同附著類型的海流機水下圖像,然后使用開源工具labelme進行語義標注,從而完成原始圖像-語義標簽數據集的創建:背景,葉片,附著物分別被標注為0,1,2;
步驟二、采用[0°,360°]的旋轉數據增強技術擴充原始圖像-語義標簽數據集,然后對原始圖像進行標準化預處理:
其中,x表示海流機圖像中R,G,B任意一個維度的數據;xmin,xmax分別表示x中的最小,最大像素值;x最終被標準化到[-1,1];
再將增強后的數據按3:1:1的比例劃分為訓練集、驗證集和測試集;
步驟三、搭建VGG16-SegUnet新型語義分割網絡:將VGG16前13層的卷積和最大池化模型設定為特征提取編碼層并使用ImageNet預訓練權重初始化這些卷積結構;解碼層的結構與SegNet中的解碼層相同,采用反最大池化進行特征恢復;編碼層與解碼層之間除前向連接外,還融合了Unet中的特征級聯以及SegNet中的最大池化索引保留技術,并在中間位置插入了一個30%dropout層;Dropout的引入在緩解訓練過擬合現象的同時,也提供了不同的概率分類結果;
步驟四、將預處理好的訓練集圖像數據輸入至VGG16-SegUnet中,輸出逐像素softmax概率分類結果:
其中,x(i)表示一張訓練圖像x中的第i個像素點;θ為softmax分類器的權重參數矩陣,且p(y(i)=l|x(i);θ)表示x(i)的預測結果y(i)為語義標簽l的概率;N表示待語義標注的類別個數;exp(·)表示指數函數;hθ(x(i))為softmax預測結果向量;
然后,使用Adadelta優化器對整個網絡進行全局訓練,降低交叉熵損失直到訓練次數達到設定的最大值,并記錄最終的訓練權重:
其中,Loss(θ)表示交叉熵損失函數;Ntrain表示訓練數據的個數;Nn表示第n張圖像的像素總個數;log(·)表示對數函數;1{·}是一個示性函數,當{·}內的表達式成立時,輸出1,反之,輸出0;
步驟五、將預處理好的測試集圖像輸入到載入了訓練權重的VGG16-SegUnet中,輸出語義分割圖,完成對圖像中背景、葉片、附著物位置和大小的識別,同時對識別結果的不確定度進行估計,具體實現過程如下:
i.將每張測試圖像輸入到融合有30%dropout的VGG16-SegUnet中,并重復進行50次測試,得到50個softmax概率分類結果,這里記為Test50;
ii.求取Test50的均值以及方差
iii.從中找出每個像素點的最大概率類別,然后通過可視化技術顯示出語義分割圖;最大概率類別對應的方差以圖像的形式直觀地顯示出來,即為不確定度圖像;
步驟六、最后,根據語義分割圖計算出精確的附著物面積占比以及識別準確率指標MIoU:
其中,AAP為附著物面積占比;attachment,blade分別表示附著物和整個海流機葉片區域;Count(·)用于計算指定區域內的像素點個數;
其中,MIoU表示平均交并比;pij表示真實標簽為i而被誤識別為標簽j的像素個數;pii表示真實標簽為i且被識別為標簽i的像素個數;pji表示真實標簽為j而被誤識別為標簽i的像素個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海海事大學,未經上海海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911132810.1/1.html,轉載請聲明來源鉆瓜專利網。





