[發明專利]基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法在審
| 申請號: | 201910089320.1 | 申請日: | 2019-01-30 |
| 公開(公告)號: | CN109886154A | 公開(公告)日: | 2019-06-14 |
| 發明(設計)人: | 李耶;殷光強;石方炎;候少麒;殷雪朦 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08;G06T3/40;G06T3/60;G06T5/00 |
| 代理公司: | 成都其高專利代理事務所(特殊普通合伙) 51244 | 代理人: | 廖曾;賀立中 |
| 地址: | 611731 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 外觀屬性 數據集 預處理 圖像 卷積神經網絡 目標監控場景 目標姿態變化 數據集數據 監控場景 監控視頻 目標場景 實際場景 損失函數 因素影響 構建 遮擋 光照 聯合 改進 學習 | ||
1.基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:包括以下步驟:
1)獲取含有行人的監控視頻片段,對行人圖像進行預處理;
2)構建新的Inception V3卷積神經網絡模型;
3)改進logistic loss損失函數;
4)輸入多個公開數據集數據,進行訓練,得到行人外觀屬性識別模型;
5)利用所得行人外觀屬性識別模型進行實際場景下的識別。
2.根據權利要求1所述的基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:所述步驟1)包括以下具體步驟:
1.1)將截取的視頻幀按照規定的圖片命名方式進行命名,保存到指定位置;
1.2)對所有的圖片文件進行外觀屬性標注,形成數據集;
1.3)將數據集分成兩部分,分別為訓練集、驗證集,訓練集用于訓練模型,驗證集用于測試模型效果,不參與訓練,其中,訓練集占總圖片數量的70~90%,測試集占總圖片數量的10~30%。
3.根據權利要求1所述的基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:所述新的Inception V3卷積神經網絡模型包括5個卷積層、11個block結構及4個并列的全連接層;所述卷積層和block結構用于自動提取行人屬性特征;全連接層用于組合屬性特征,獲取對應屬性分數。
4.根據權利要求1所述的基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:所述步驟3)具體為:將每個全連接層后皆加一個loss函數,最后計算所有loss之和,來進行多數據集聯合訓練。
5.根據權利要求4所述的基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:所述loss函數為:
其中N表示訓練時每次送入的圖片數量,C為行人對應的外觀屬性數量,每個行人圖片表示為xn,對應經過網絡計算的輸出為Vn,對應的標簽向量為yn,每個標簽向量對應的屬性值為yn,i,i∈[1,2,...,C],如果yn,i=1表明這個訓練樣本xn有這個屬性,如果yn,i=0表明這個訓練樣本xn沒有這個屬性;Sn,i表示這個樣本xn的第i個屬性的得分高低,Sn,i∈[0,1],yn,i是真實屬性標簽,表示行人樣本xn有沒有第i個屬性。
6.根據權利要求1所述的基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:所述步驟4)包括以下具體步驟:
4.1)訓練之前,準備大于6G顯存的GPU和linux系統環境,搭建pytorch環境;
4.2)設置模型訓練的優化方式;
4.3)設置模型訓練的圖片預處理方式;
4.4)設置模型的基礎學習率、動量權重以及最大迭代次數,在最大迭代次數下,不斷迭代學習,直到損失函數值不再下降,模型收斂,保存模型參數;
4.5)完成訓練,得到行人外觀屬性識別模型。
7.根據權利要求6所述的基于Inception V3的多數據集聯合訓練的行人外觀屬性識別方法,其特征在于:所述步驟4.3)包括以下具體步驟:
4.3.1)改變圖片的亮度、對比度和飽和度;
4.3.2)經過步驟4.3.1)后,將圖片進行隨機的水平翻轉;
4.3.3)經步驟4.3.2)后,將圖片最短邊縮放到150像素,長邊按照1:3的比例縮放到450像素;
4.3.4)經步驟4.3.3)后,縮放的圖片不進行裁剪,直接送入網絡進行訓練。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910089320.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





