[發明專利]一種基于支持向量機的水下目標視覺識別分類方法在審
| 申請號: | 202011635352.6 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112733914A | 公開(公告)日: | 2021-04-30 |
| 發明(設計)人: | 劉彥呈;朱鵬蒞;陳瀚;董張偉;劉厶源;于春來;郭昊昊;陳洋 | 申請(專利權)人: | 大連海事大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 大連東方專利代理有限責任公司 21212 | 代理人: | 姜玉蓉;李洪福 |
| 地址: | 116026 遼*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 支持 向量 水下 目標 視覺 識別 分類 方法 | ||
1.一種基于支持向量機的水下目標視覺識別分類方法,其特征在于包括:
對拍攝到的原始水下圖像進行圖像預處理,包括將圖像的多維度環境特征轉換到HSV顏色空間進行去背景處理、解算得到包含目標的二值化圖像;
將二值化圖像映射到原始水下圖像中進行剪裁處理獲得目標圖像;
提取目標物圖像的HOG特征信息,通過計算和統計圖像局部區域的梯度方向直方圖從而構造HOG特征信息;
以目標物和障礙物為標簽信息基于HOG特征信息訓練優化支持向量機,尋求最優分類方式從而對目標物和障礙物進行分類處理;
采用水下航行器進行實驗,通過真實環境實驗和仿真分析驗證所提出的基于支持向量機的水下目標視覺識別分類方法的有效性和穩定性。
2.根據權利要求1所述的方法,其特征還在于:將拍攝到的多維度水下環境特征轉換到HSV顏色空間進行去背景處理:
設(r,g,b)分別為水下圖像顏色的紅、綠和藍坐標,設max為(r,g,b)中的最大者,設min為(r,g,b)中的最小者,計算在HSV空間中的(h,s,v)值,其中h∈[0,360)為角度的色相角,s,v∈[0,1)為飽和度和亮度,采用多維度環境特征空間轉換方式將RGB圖像轉換為HSV圖像,對圖像進行過濾背景處理,在閾值化處理和圖像合成階段,對HSV三通道圖像分別設置對應顏色上限閾值和下限閾值,經過上下限濾波得到HSV的三個單通道圖像,通過運算合并三通道圖像、獲得包含目標的二值化圖像;在包含目標的二值化圖像中提取目標的輪廓信息,根據輪廓信息得到繪制輪廓的點在x方向上和在y方向上的最大值xmax、ymax和最小值xmin,ymin,根據(xmax,ymin),(xmax,ymax),(xmin,ymin),(xmin,ymax)四個點坐標在水下航行器所拍攝的RGB圖像截取對應的矩形區域。
3.根據權利要求1所述的方法,其特征還在于:以包含目標物的圖像為正樣本信息、包含障礙物的圖像為負樣本信息,對正負樣本提取HOG特征信息,通過計算和統計圖像局部區域的梯度方向直方圖構成HOG特征,將圖像分成多個單元格細胞,采集其中各像素點的梯度或邊緣方向直方圖并組合構成特征描述器,具體方式為:
采用[-1,0,1]梯度算子對原圖像做卷積運算得到x方向的梯度分量,采用[1,0,-1]T梯度算子對原圖像做卷積運算,得到y方向的梯度分量;
采用以下公式計算該像素點的梯度大小和方向,圖像中像素點(x,y)的梯度為:
Gx(x,y)=H(x+1,y)-H(x-1,y) (4)
Gy(x,y)=H(x,y+1)-H(x,y-1) (5)
其中,Gx(x,y),Gy(x,y),H(x,y)分別表示輸入圖像中像素點(x,y)處的水平方向梯度、垂直方向梯度和像素值,像素點(x,y)處的梯度幅值和梯度方向分別為
將圖像分成若干個單元格細胞,每個單元格細胞為8×8個像素,將單元格細胞的梯度方向360度分成9個方向塊來統計該8×8個像素的梯度信息,即zn=[20(n-1),20n),[180+20(n-1),180+20n)|n∈[1,9),如果像素的梯度方向α(x,y)∈zn,則在直方圖第n個方向塊的統計中加上1×G(x,y);
在每個單元格細胞里,對所有像素的各個梯度方向區間進行直方圖統計,得到9維的特征向量,每相鄰的4個單元格細胞構成一個塊,每個塊的尺寸為16×16,把一個塊內的特征向量聯起來得到64維的特征向量,用塊對樣本圖像進行掃描,掃描步長為一個單元,步長設置為8×8,最后將所有塊的特征串聯得到目標的HOG特征。
4.根據權利要求1所述的方法,其特征還在于:將目標物的HOG特征x1,x2,x3,…,xn和障礙物的HOG特征xn+1,xn+2,xn+3,…,xm分別帶入到分類超平面f(xi)=wTxi+b,使其滿足:
式中,wT∈H超平面法向量,H表示內積空間,b∈R表示偏移量,yi表示類別,當yi=1時標簽為目標物,當yi=-1標簽為障礙物,在約束條件yi(wTxi+b)≥1,i=1,2,…,m下,已有訓練樣本集中求解
引入引入拉格朗日函數:
α=α1,α2,…,αn為拉格朗日乘子向量,通過對其對偶問題的求解求得最優的超平面參數為和b*,最后得到最優分類超平面函數為
通過將圖像的HOG特征帶入到最優分類超平面函數,若結果為正,則為目標物,反之則為障礙物,最后將識別結果映射到二值圖像中。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連海事大學,未經大連海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011635352.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:號角單元、號角組陣裝置及發聲裝置
- 下一篇:一種單穩態旋鈕換擋裝置





