[發明專利]一種基于卷積神經網絡的監控場景下行人屬性識別方法在審
| 申請號: | 201711226381.5 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN107862300A | 公開(公告)日: | 2018-03-30 |
| 發明(設計)人: | 胡誠;陳亮;張勛 | 申請(專利權)人: | 東華大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 上海泰能知識產權代理事務所31233 | 代理人: | 宋纓,錢文斌 |
| 地址: | 201620 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 卷積 神經網絡 監控 場景 行人 屬性 識別 方法 | ||
1.一種基于卷積神經網絡的監控場景下行人屬性識別方法,其特征在于,包括以下步驟:
(1)獲取含有行人的監控視頻,并截取視頻幀,構建監控場景下的行人數據集;
(2)通過改進AlexNet卷積神經網絡模型,構建新的卷積神經網絡模型;
(3)把所述行人數據集輸入到所述新的卷積神經網絡模型中進行訓練,得到行人屬性識別模型;
(4)利用所述行人屬性識別模型完成識別。
2.根據權利要求1所述的基于卷積神經網絡的監控場景下行人屬性識別方法,其特征在于,所述步驟(1)包括以下子步驟:
(11)將截取的視頻幀按照規定的圖片命名方式進行命名,并把全部的圖片縮放到統一大小,得到圖片文件;
(12)對所有的圖片文件進行標注:每一張行人圖片上的行人屬性都是二進制屬性,如果有行人屬性,則標簽值為1;如果沒有行人屬性,則標簽值為0;
(13)按照廣泛采取的實驗數據集劃分原則,隨機的把所述圖片文件分為三部分:分別為訓練集、驗證集和測試集,其中,訓練集占總圖片文件的50%,驗證集占總圖片文件的10%,測試集占總圖片文件的40%;
(14)根據圖片文件的劃分構建行人數據集,其中行人數據集包括兩部分:一部分為用于模型訓練的訓練數據,另一部分為用于檢驗模型訓練效果的測試數據。
3.根據權利要求1所述的基于卷積神經網絡的監控場景下行人屬性識別方法,其特征在于,所述步驟(2)中的AlexNet模型總共有八層,包括5個卷積層和3個全連接層;所述卷積層用于自動提取特征,所述全連接層用于連接所有的特征,并將輸出值輸入給softmax分類,所述全連接層輸出的節點數對應行人屬性的類別;所述AlexNet模型的損失函數為其中,N表示圖片文件中的數量,L為圖片文件中的行人屬性的數量,每張行人圖片表示為xi,i∈[1,2,...N],每張圖片xi對應的行人屬性標簽向量為yi,每個標簽向量yi對應的屬性值為yil,yil∈[0,1],l∈[1,2,...,L],如果yil=1表明這個訓練樣本xi有這個屬性;如果yil=0表明這個訓練樣本xi沒有這個屬性;表示是行人樣本xi的第l個屬性的概率。yil是真實屬性標簽,表示行人樣本xi有沒有第l個屬性。
4.根據權利要求1所述的基于卷積神經網絡的監控場景下行人屬性識別方法,其特征在于,所述步驟(3)具體包括以下子步驟:
(31)訓練之前搭建Caffe環境,然后編譯Caffe;
(32)設置模型的學習率和權重衰減,然后在設置的最大迭代學習次數下,不斷迭代學習,直至損失函數的損失值最小,模型收斂,保存模型參數;
(33)完成訓練得到行人屬性識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華大學,未經東華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711226381.5/1.html,轉載請聲明來源鉆瓜專利網。





