[發明專利]一種基于深度相似性網絡的圖像分類方法有效
| 申請號: | 201710313616.8 | 申請日: | 2017-05-05 |
| 公開(公告)號: | CN108805151B | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 胡東平;王興剛 | 申請(專利權)人: | 杭州微禾迅科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 無錫市匯誠永信專利代理事務所(普通合伙) 32260 | 代理人: | 張歡勇 |
| 地址: | 310000 浙江省杭州市西*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 相似性 網絡 圖像 分類 方法 | ||
1.一種基于深度相似性網絡的圖像分類方法,其特征在于,該方法包含以下步驟:
訓練圖片輸入步驟,從指定訓練圖像中隨機選擇特定數目以及指定類型的圖片作為訓練圖像;
模型訓練步驟,通過構建特定的訓練模型并向該模型輸入訓練圖片進行特定次數訓練得到圖像特征提取模型參數;
初始化特征提取網絡步驟,采用訓練得到的網絡模型參數集初始化用于圖像特征提取的網絡模型;
特征提取步驟,利用初始化的網絡模型對輸入圖像的圖像特征進行提取操作;
相似度計算步驟,根據訓練得到的圖像特征和實際提取的圖像特征進行特定計算得出相似度計算模型;
圖像分類步驟,采用相似度計算模型得到的圖像特征進行圖像分類;
所述特征提取步驟中,實際圖片的特征提取操作完成后,加入相似度計算操作計算出訓練圖片與實際檢測圖片特征的相似度關系;
所述相似度計算采用下面公式:
其中,K為卷積層數,為實際圖片的最大全連接層的上一層輸出,f(RK)為訓練圖像的特征值。
2.如權利要求1所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述模型訓練步驟中,所述訓練模型包括:單卷積層、ReLU激活層、池化層、全連接層、交叉熵損失函數判定層和圖像特征提取層。
3.如權利要求2所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述單卷積層有64個5*5卷積核,卷積公式為:
Zl[Xi]=Wl*Fl-1(Xi)+Bl
其中l表示全連接層的層數,Fl-1表示第l-1層的輸出,Wl為第l層的權值參數,Bl為第l層的偏置參數。
4.如權利要求2所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述池化層采用的核心大小為3*3,步長為2個像素;所述全連接層第一層采用384個輸出結點,第二層采用192個輸出結點。
5.如權利要求2所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述訓練模型的訓練方法為:利用網絡的預測類別標簽與真實類別標簽,采用反向傳播算法來訓練雙通道卷積神經網絡。
6.如權利要求2所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述交叉熵損失函數為:
其中i表示第i張樣本圖片,n表示樣本訓練集的數量,yic表示第i張圖片c類別網絡預測值,tic表示相應圖片c類別的真實值。
7.如權利要求1所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述模型訓練步驟中,具體訓練步驟為:進行一次單卷積操作、ReLU激活操作、池化操作、全連接操作、交叉熵損失函數判定調整模型參數操作。
8.如權利要求7所述的一種基于深度相似性網絡的圖像分類方法,其特征在于,所述訓練步驟按照順序重復執行一遍后執行圖像特征提取操作。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州微禾迅科技有限公司,未經杭州微禾迅科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710313616.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種基于格網地形特征的空域可通行性分析方法
- 下一篇:一種場景分類方法及裝置





