[發明專利]一種基于卷積神經網絡的狗臉識別方法在審
| 申請號: | 202110292577.4 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN113128341A | 公開(公告)日: | 2021-07-16 |
| 發明(設計)人: | 顏成鋼;馬立棟;許成浩;孫垚棋;張繼勇;張勇東 | 申請(專利權)人: | 杭州電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 杭州君度專利代理事務所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 310018 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 識別 方法 | ||
1.一種基于卷積神經網絡的狗臉識別方法,其特征在于,包括以下步驟:
步驟(1)、采集狗臉圖像,構建用于模型訓練的狗臉數據集,將獲得的狗臉數據集劃分為訓練數據集和測試數據集;
步驟(2)、圖像預處理;
對數據集中的狗臉以及它的左眼,右眼,鼻子,左嘴角和右嘴角進行人工手動標注,然后使用特征點坐標仿射變換的方法對狗臉圖像進行狗臉位置對齊,然后對狗臉圖像進行裁剪;
步驟(3)、構建識別網絡模型;
采用殘差結構構建卷積神經網絡作為特征提取網絡,即識別網絡模型,采用加法角余量損失(Additive Angular Margin Loss)作為輸出層的損失函數;
步驟(4)、使用訓練數據集并采用隨機梯度下降法訓練識別網絡模型及調參優化;
步驟(5)、根據測試協議,使用測試數據集對訓練好的識別網絡模型進行準確率評估。
2.根據權利要求1所述的一種基于卷積神經網絡的狗臉識別方法,其特征在于,所述步驟(1)的具體實現方法為:對每條狗采集多張狗臉圖像,拍攝角度任意,但拍攝的狗臉圖像需要包含左眼,右眼,鼻子,左嘴角和右嘴角,對采集到的狗臉圖像數據根據狗的身份進行編號,并將狗臉圖像數據按8:2的比例隨機劃分為訓練數據集和測試數據集;并從整個狗臉數據集中對每條狗選出一張它的清晰的狗臉圖像作為圖集,該狗臉圖集用于測試使用。
3.根據權利要求2所述的一種基于卷積神經網絡的狗臉識別方法,其特征在于,所述步驟(2)的具體實現方法為:首先,使用電腦標注軟件對數據集中的狗臉進行矩形框框選,以及對狗臉的左眼中心點、右眼中心點、鼻子點、左嘴角點和右嘴角點進行特征點坐標標注;完成標注后,使用特征點坐標仿射變換的方法對狗臉圖像進行裁剪對齊預處理處理;
所述坐標點仿射變換是指二維坐標到二維坐標之間的線性變換,通過一系列的平移、縮放、翻轉、旋轉和剪切來實現;經過坐標點仿射變換后,狗臉的五個特征點將配準到預先定義好的五點模板上,完成狗臉對齊;
所述裁剪使用雙線性插值算法,在兩個方向分別進行一次線性插值。
4.根據權利要求3所述的一種基于卷積神經網絡的狗臉識別方法,其特征在于,所述識別網絡模型用于提取狗臉圖像的特征,由1個全連接層和10個卷積層組成,其中包括第一殘差模塊和第二殘差模塊,數量分別為1和2;所述卷積層包含卷積核(Conv2d)、歸一化層(BatchNorm2d)和激活層(ReLU)。
5.根據權利要求4所述的一種基于卷積神經網絡的狗臉識別方法,其特征在于,識別網絡模型運算步驟依次為:輸入狗臉圖像,首先通過大小為3×3,通道數為64的卷積層;然后通過大小為3×3,通道數為128,步長為2的卷積層;再通過第一殘差模塊;之后通過大小為3×3,通道數為256,步長為2的卷積層;然后通過兩次重復的第二殘差模塊;隨后通過大小為3×3,通道數為512,步長為2的卷積層;最后通過全連接層得到最終128維的特征向量;
所述第一殘差模塊由一個大小為1×1,通道數為64的卷積層和一個大小為3×3,通道數為128的卷積層組成;
所述第二殘差模塊由一個大小為1×1,通道數為128的卷積層和一個大小為3×3,通道數為256的卷積層組成;
所述殘差結構是指輸入經過1×1卷積層和3×3卷積層后的特征與輸入特征相加,然后得到其輸出特征。
6.根據權利要求5所述的一種基于卷積神經網絡的狗臉識別方法,其特征在于,所述加法角余量損失函數表達式如下:
W為權值向量,x為特征向量,θ為特征向量x與權值向量W間的夾角;m是常數,控制類別之間的差距;s是一個縮放因子;N是樣本數。
7.根據權利要求6所述的一種基于卷積神經網絡的狗臉識別方法,其特征在于,所述加法角余量損失函數具體實現流程為:特征向量x和一個全連接層W之間的點積等于特征和權重歸一化后的余弦距離cos(θ);利用反余弦函數來計算當前特征與目標權重之間的夾角θ;然后,在目標角度上加上一個相加的角度裕度m;在后,用固定的s重新縮放得到scos(θ)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州電子科技大學,未經杭州電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110292577.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種納米刀穿刺手術的無級調節固定支架
- 下一篇:泥鰍催產針自動注射機構





