[發(fā)明專利]結(jié)合ResNet和SENet的低分辨率行人檢測方法、系統(tǒng)及存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201811403739.1 | 申請日: | 2018-11-23 |
| 公開(公告)號: | CN109522855B | 公開(公告)日: | 2020-07-14 |
| 發(fā)明(設(shè)計)人: | 趙清利;梁添才;金曉峰;徐天適 | 申請(專利權(quán))人: | 廣州廣電銀通金融電子科技有限公司;廣州廣電運通金融電子股份有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 廣州市華學知識產(chǎn)權(quán)代理有限公司 44245 | 代理人: | 林梅繁 |
| 地址: | 510000 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 結(jié)合 resnet senet 分辨率 行人 檢測 方法 系統(tǒng) 存儲 介質(zhì) | ||
1.結(jié)合ResNet和SENet的低分辨率行人檢測方法,其特征在于,包括訓練過程和測試過程,所述訓練過程包含以下步驟:
步驟11、確定所需的行人數(shù)據(jù)集,把數(shù)據(jù)集按照一定的比例劃分為訓練集和測試集,將訓練集轉(zhuǎn)化為合適的輸入格式用于模型訓練;
步驟12、確定模型訓練過程所需的預(yù)訓練模型,在預(yù)訓練模型的基礎(chǔ)上進行訓練,確定訓練過程的訓練參數(shù);訓練參數(shù)包括訓練的總迭代次數(shù)、模型迭代的批處理大小、學習率;
步驟13、按照設(shè)定的批處理大小將小批量訓練數(shù)據(jù)送入已訓練的基礎(chǔ)網(wǎng)絡(luò),經(jīng)過基礎(chǔ)網(wǎng)絡(luò)逐層的語義信息抽取后,由基礎(chǔ)網(wǎng)絡(luò)的多尺度檢測框架進行特征提取,通過基礎(chǔ)網(wǎng)絡(luò)的淺層網(wǎng)絡(luò)提取低分辨率行人的特征,通過基礎(chǔ)網(wǎng)絡(luò)的深層網(wǎng)絡(luò)提取高分辨率行人的特征;
步驟14、通過淺層特征重構(gòu)層將多尺度檢測框架中深層網(wǎng)絡(luò)的特征信息疊加到淺層網(wǎng)絡(luò)的特征中,對多尺度檢測框架中淺層網(wǎng)絡(luò)的特征層進行重構(gòu);
步驟15、對淺層特征重構(gòu)層進行特征增強操作,將增強后的重構(gòu)層代替原始多尺度檢測框架中最淺層網(wǎng)絡(luò)的特征提取層,與其他的特征提取層重新組合形成新的多尺度檢測框架;
步驟16、對新的多尺度檢測框架進行分類和回歸,求得行人的類別和位置;
步驟17、計算訓練損失,并將訓練損失進行反向傳播,更新權(quán)重參數(shù);
步驟18、判斷是否完成訓練的總迭代次數(shù),若完成總迭代次數(shù),則終止模型的訓練;否則返回步驟13繼續(xù)訓練;
所述測試過程包含以下步驟:
步驟21、確定測試集并轉(zhuǎn)化為合適的輸入格式用于模型測試;
步驟22、將訓練過程訓練得到的模型作為測試模型,確定測試過程的批處理大小;
步驟23、按照設(shè)定的批處理大小將小批量測試數(shù)據(jù)送入測試基礎(chǔ)網(wǎng)絡(luò),經(jīng)過基礎(chǔ)網(wǎng)絡(luò)逐層的語義信息抽取后,由基礎(chǔ)網(wǎng)絡(luò)的多尺度檢測框架進行特征提取,通過基礎(chǔ)網(wǎng)絡(luò)的淺層網(wǎng)絡(luò)提取低分辨率行人的特征,通過基礎(chǔ)網(wǎng)絡(luò)的深層網(wǎng)絡(luò)提取高分辨率行人的特征;
步驟24、通過淺層特征重構(gòu)層將多尺度檢測框架中深層網(wǎng)絡(luò)的特征信息疊加到淺層網(wǎng)絡(luò)的特征中,對多尺度檢測框架中淺層網(wǎng)絡(luò)的特征層進行重構(gòu);
步驟25、對淺層特征重構(gòu)層進行特征增強操作,將增強后的重構(gòu)層代替原始多尺度檢測框架中最淺層網(wǎng)絡(luò)的特征提取層,與其他特征提取層重新組合形成新的多尺度檢測框架;
步驟26、對新的多尺度檢測框架進行分類和回歸,求得行人的類別和位置;
步驟27、若測試圖片取完,則完成模型的測試;否則返回步驟23繼續(xù)測試;
步驟15或步驟25中,采用SENet對淺層特征重構(gòu)層進行增強,增強過程的步驟為:
首先進行Squeeze操作,順著空間維度來進行特征壓縮,將每個二維的特征通道變成一個實數(shù),這個實數(shù)具有全局的感受野,并且輸出的維度和輸入的特征通道數(shù)相匹配;其次進行Excitation操作,通過參數(shù)來為每個特征通道生成權(quán)重,顯式地建模特征通道間的相關(guān)性;最后進行Reweight的操作,將Excitation輸出的權(quán)重看做是經(jīng)過特征選擇后的每個特征通道的重要性,然后通過乘法逐通道加權(quán)到先前的特征上,完成在通道維度上的對原始特征的重標定。
2.根據(jù)權(quán)利要求1所述的低分辨率行人檢測方法,其特征在于,訓練過程所使用的網(wǎng)絡(luò)和測試過程所使用的網(wǎng)絡(luò)結(jié)構(gòu)相同。
3.根據(jù)權(quán)利要求1所述的低分辨率行人檢測方法,其特征在于,步驟14或步驟24中,在進行淺層網(wǎng)絡(luò)的特征重構(gòu)時,將深層網(wǎng)絡(luò)的特征進行反卷積操作,使其與淺層網(wǎng)絡(luò)的特征圖大小相同,再把兩個特征圖進行疊加得到重構(gòu)的特征圖。
4.根據(jù)權(quán)利要求1所述的低分辨率行人檢測方法,其特征在于,步驟17所述的訓練損失包括分類損失和回歸損失,其中分類損失采用Softmax Loss函數(shù),回歸損失采用Smooth L1Loss函數(shù)。
5.根據(jù)權(quán)利要求1所述的低分辨率行人檢測方法,其特征在于,步驟17采用SGD方法對網(wǎng)絡(luò)的權(quán)重參數(shù)進行更新。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州廣電銀通金融電子科技有限公司;廣州廣電運通金融電子股份有限公司,未經(jīng)廣州廣電銀通金融電子科技有限公司;廣州廣電運通金融電子股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811403739.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種嵌入SENet結(jié)構(gòu)的改進YOLOV3目標識別方法
- 基于結(jié)構(gòu)特征自增強的CT-MR模態(tài)遷移方法
- 一種基于改進YOLOv3的車輛檢測方法
- 一種基于級聯(lián)網(wǎng)絡(luò)的交通錐識別方法及裝置
- 嵌入SENet單元的無監(jiān)督單目圖像深度圖生成方法
- 一種基于多視點深度特征融合SENet網(wǎng)絡(luò)的分類方法
- 一種基于RP-ResNet網(wǎng)絡(luò)的抓取檢測方法
- 基于senet的宮頸細胞圖像分類方法
- 一種基于注意力機制與空間幾何約束的行人重識別方法
- 一種融合人群信息的語音情感識別方法和系統(tǒng)





