[發明專利]基于DCT-CNN模型的無人機著陸地貌圖像分類方法有效
| 申請號: | 201711028874.8 | 申請日: | 2017-10-29 |
| 公開(公告)號: | CN107748895B | 公開(公告)日: | 2021-06-25 |
| 發明(設計)人: | 劉芳;路麗霞;黃光偉;王洪娟;王鑫;吳志威 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京思海天達知識產權代理有限公司 11203 | 代理人: | 沈波 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 dct cnn 模型 無人機 著陸 地貌 圖像 分類 方法 | ||
1.基于DCT-CNN模型的無人機著陸地貌圖像分類方法,其特征在于,該方法包括以下步驟,
S1:獲取無人機著陸地貌圖像,圖像分為訓練圖像集和測試圖像集;
S2:對無人機著陸地貌圖像DCT變換,并進行DCT系數的篩選,具體如下:
S2.1:首先對無人機著陸地貌圖像進行8×8分塊,對無人機著陸地貌進行分塊后形成子塊,對每個子塊分別進行DCT變換;
S2.2:DCT變換后得到8×8的系數矩陣,對DCT系數進行選擇,按照ZigZag掃描的方式保留矩陣左上角的10個低頻系數;
S2.3:對剩余的54個系數采用系數判別法進行系數選擇;提出的系數判別法是:首先求每一個子塊的平均值,并設定平均值為每塊的系數閾值,然后對每個子塊中剩余的54個系數進行選擇,如果系數小于設定的閾值則該系數置0,大于閾值則保留該系數;
S2.4:把每幅圖像篩選的DCT系數進行整合得到DCT系數矩陣;
S3:針對無人機著陸地貌圖像場景復雜、信息豐富的特點構建了一個14層用于無人機著陸地貌圖像分類的DCT-CNN網絡結構,包括一個輸入層、五個卷積層、三個池化層,四個ReLU層和一個輸出層,具體如下:
S3.1:DCT-CNN模型中的五層卷積層為5-6-9-4-1結構,卷積核大小分別為:第一層卷積層是5×5,第二層是6×6,第三層是9×9,第四層是4×4,第五層為1×1;
S3.2:DCT-CNN模型中的池化層采用了平均池化和最大值池化兩種方法,總共有三層池化層,第一個池化層采用平均池化,后兩層池化采用最大值池化;
S3.3:DCT-CNN模型中增加了zero padding,表示對特征圖進行0填充操作,當pad=1時,將每張輸入特征圖向四周擴展1格用0填充,填充后相當于長、寬各加2,之后再進行卷積、池化過程;
S3.4:在該網絡結構中,每一層卷積層后面接著一層激活函數層,是為了給網絡加入非線性的因素,使得卷積神經網絡可以更好地解決較為復雜的問題,該卷積神經網絡中采用的是ReLU激活函數,其公式為:
f(x)=max(0,x)
x為ReLU激活函數自變量;
S4:將訓練集的DCT系數輸入到改進的DCT-CNN模型中訓練,并對網絡進行參數更新,直到損失函數收斂于一個較小的值,訓練結束;
S5:將訓練圖像特征集作為訓練樣本對SVM分類器進行訓練;
S6:輸入測試集,利用訓練好的模型對測試圖像的DCT系數進行逐層學習,最后將得到的一維特征向量輸入到訓練好的SVM分類器中進行分類,得到分類結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711028874.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種視頻現場異地重構方法
- 下一篇:一種半自動電池模組螺母鎖緊設備





