[發明專利]一種高精度水下激光目標識別系統有效
| 申請號: | 202110023549.2 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112926619B | 公開(公告)日: | 2022-06-24 |
| 發明(設計)人: | 劉興高;萬子寧;王文海;張志猛;張澤銀 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06V10/764 | 分類號: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是專利事務所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 高精度 水下 激光 目標 識別 系統 | ||
1.一種高精度水下激光目標識別系統,其特征在于:包括依次相連的水下激光探測器、數據庫及上位機,所述上位機包括依次相連的數據生成模塊、數據預處理模塊、目標分類模塊和結果顯示模塊;所述激光探測器對所檢測水域進行探測,并將得到的圖像存儲到所述的數據庫,數據生成模塊對激光探測器采集到的圖像進行生成,以擴展可用圖像數量;數據預處理模塊將水下激光探測器采集的圖像數據和新生成的圖像數據進行預處理,目標分類模塊使用殘差卷積神經網絡訓練目標分類器,使用該搭建好的殘差卷積神經網絡進行目標分類的訓練,對預處理后的圖像數據進行識別,結果顯示模塊將目標分類的結果展示在上位機中;
所述數據生成模塊對激光探測器采集到的圖像進行生成,以擴展可用圖像數量,采用如下過程完成:
(1)從數據庫中采集K個圖像作為訓練樣本集,記為其中代表第i個訓練樣本;
(2)從噪聲數據先驗分布P(z)中采集K個噪聲作為噪聲樣本集,記為其中代表第i個噪聲樣本;
(3)采用卷積神經網絡作為生成器G,從噪聲數據中生成新的數據,其中代表第i個新生成的樣本;
(4)采用卷積神經網絡作為判別器D,并更新判別器的參數θd,具體公式如下:
其中,VD為判別器D關于θd的損失函數,為第(1)步中采集的訓練樣本,為第(3)步中生成的新樣本,i為樣本索引,m為訓練批次大小,η為學習率,為關于θd的梯度;
(5)更新生成器G的參數θg,具體公式如下:
其中,VG為判別器G關于θG的損失函數,為第(2)步中采集的噪聲樣本,i為樣本索引,m為訓練批次大小,η為學習率,為關于θg的梯度;
(6)重復上述(1)~(5)步驟,直到VD和VG收斂;
(7)設定想要生成的圖片數目M,從噪聲數據先驗分布P(z)中采集M個噪聲作為噪聲樣本,采用訓練好的生成器G,從噪聲數據中生成新的數據其中將新生成的圖片數據加入數據庫;
所述數據預處理模塊將水下激光探測器采集的圖像數據和新生成的圖像數據進行預處理,采用如下過程完成:將數據庫中所有樣本圖像其中代表第i個樣本圖像,總數為N;對訓練樣本的灰度直方圖進行均衡化處理,公式如下:
其中,i=1,2,...,N,j=0,1,2,...,L-1,uij第i個樣本的第j個灰度級均衡化后的結果,RN表示圖像像素的行數,CN表示圖像像素的列數,L表示圖像的灰度級數量,ne表示當前圖像中灰度為re的像素的個數,pr(re)表示概率分布,T(rj)表示當前圖像中第j個灰度級的直方圖均衡化變換;灰度直方圖進行均衡化處理后的圖像為U={u1,u2,...,uN}。
2.根據權利要求1所述一種高精度水下激光目標識別系統,其特征在于:所述目標分類模塊使用殘差卷積神經網絡訓練目標分類器;殘差卷積神經網絡在深度學習框架下構建,構建的殘差卷積網絡具體結構為:
(1)卷積池化層:首先對128×128×3的輸入圖像作卷積,卷積核個數為64、大小為7×7、移動步數為2,對卷積層的輸出進行ReLU非線性變換后作最大值池化,池化窗口大小為2×2、移動步數為2,最后輸出的特征圖維數為32×32×64;
(2)殘差結構塊一:由3個殘差結構組成,第一個和第二個殘差結構的卷積層的卷積核個數都為64、窗口大小都為3×3、移動步數都為1,捷徑連接為恒等映射,第三個殘差結構的第一個卷積層的卷積核個數為128、卷積窗口大小為3×3、移動步數為2,第二個卷積層的卷積核個數為128、窗口大小為3×3、移動步數為1,其捷徑連接含有一個卷積核個數為128、窗口大小為3×3、移動步數為2的卷積層,最終輸出的特征圖維數為16×16×128;
(3)殘差結構塊二:由3個殘差結構組成,第一個和第二個殘差結構的卷積層的卷積核個數都為128、窗口大小都為3×3、移動步數都為1,捷徑連接為恒等映射,第三個殘差結構的第一個卷積層的卷積核個數為256、卷積窗口大小為3×3、移動步數為2,第二個卷積層的卷積核個數為256、窗口大小為3×3、移動步數為1,其捷徑連接含有一個卷積核個數為256、窗口大小為3×3、移動步數為2的卷積層,最終輸出的特征圖維數為8×8×256;
(4)殘差結構塊三:由3個殘差結構組成,第一個和第二個殘差結構的卷積層的卷積核個數都為256、窗口大小都為3×3、移動步數都為1,捷徑連接為恒等映射,第三個殘差結構的第一個卷積層的卷積核個數為512、卷積窗口大小為3×3、移動步數為2,第二個卷積層的卷積核個數為512、窗口大小為3×3、移動步數為1,其捷徑連接含有一個卷積核個數為512、窗口大小為3×3、移動步數為2的卷積層,最終輸出的特征圖維數為4×4×512;
(5)分類器:對殘差結構塊三的輸出作全局平均池化,得到512維的特征向量,再用全連接層對該向量進行降維,全連接層神經元數與目標類別數相等,采用softmax激活函數作分類,輸出結果為的預測目標為各類別的概率;
使用該搭建好的殘差卷積神經網絡進行目標分類的訓練:
(A)將預處理后的樣本集劃分為訓練集和測試集;
(B)使用訓練集中的樣本對殘差卷積神經網絡模型進行訓練,在測試集上進行識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110023549.2/1.html,轉載請聲明來源鉆瓜專利網。





