[發(fā)明專利]一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法在審
| 申請?zhí)枺?/td> | 201810316553.6 | 申請日: | 2018-04-10 |
| 公開(公告)號: | CN108564025A | 公開(公告)日: | 2018-09-21 |
| 發(fā)明(設(shè)計)人: | 肖立軍;廖志偉;鄒國惠;裴星宇;萬新宇;李晨熙;韓玉龍;吳偉力;覃佳奎;姜媛 | 申請(專利權(quán))人: | 廣東電網(wǎng)有限責(zé)任公司;廣東電網(wǎng)有限責(zé)任公司珠海供電局 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/04;G06N3/08 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 44102 | 代理人: | 林麗明 |
| 地址: | 510060 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 卷積神經(jīng)網(wǎng)絡(luò) 可變形 池化 紅外圖像 物體識別 采樣 目標(biāo)檢測和識別 非線性變形 反向傳播 幾何變換 幾何形變 空間形變 目標(biāo)函數(shù) 圖像識別 興趣區(qū)域 測試集 分類器 卷積核 訓(xùn)練集 形變 構(gòu)建 建模 卷積 學(xué)習(xí) 架構(gòu) 視覺 引入 網(wǎng)絡(luò) 成功 | ||
1.一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,包括以下步驟:
S1:收集數(shù)據(jù)庫樣本并設(shè)定訓(xùn)練集與測試集,其中數(shù)據(jù)庫樣本采用COCO、PASCAL VOC并設(shè)定類別和每一個類別在分類器中的編碼,構(gòu)建訓(xùn)練集;
S2:搭建卷積神經(jīng)網(wǎng)絡(luò)架構(gòu),通過交迭若干個卷積層和池化層設(shè)置卷積神經(jīng)網(wǎng)絡(luò)的深度與寬度架構(gòu);
S3:在卷積層采用可變形卷積核進(jìn)行采樣,通過加入一個額外的卷積層來學(xué)習(xí)offset偏移量,共享輸入特征圖,然后把輸入特征圖和訓(xùn)練得到的offset偏移量共同作為可變形卷積層的輸入層,此時可變形卷積層采樣點(diǎn)發(fā)生偏移,再進(jìn)行卷積;
S4:在池化層采用可變形興趣區(qū)域進(jìn)行池化操作,其中ROI被分為n*n個bin,被輸入到一個額外的全連接層學(xué)習(xí)offset,然后通過一個可變形興趣區(qū)域池化層使每個bin發(fā)生偏移;
S5:在卷積神經(jīng)網(wǎng)絡(luò)的最后一層加上softmax分類器并設(shè)置目標(biāo)函數(shù);
S6:設(shè)置學(xué)習(xí)率參數(shù),采用后向傳播算法,使用訓(xùn)練集訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型一次,使用的得到的訓(xùn)練后的模型去識別測試集數(shù)據(jù),統(tǒng)計整體識別率;
S7:重復(fù)步驟S6,直到目標(biāo)函數(shù)值完全收斂,識別率不再提高為止,此時網(wǎng)絡(luò)參數(shù)訓(xùn)練完畢,得到可變形卷積神經(jīng)網(wǎng)絡(luò)模板,即紅外圖像物體識別系統(tǒng);
S8:應(yīng)用該系統(tǒng)進(jìn)行紅外圖像識別。
2.根據(jù)權(quán)利要求1所述的一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,步驟S1所述測試集為南方電網(wǎng)xx設(shè)備拍攝的變電站設(shè)備紅外圖像。
3.根據(jù)權(quán)利要求1所述的一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,步驟S3所述訓(xùn)練得到的offset偏移量包括通過外加offset field來訓(xùn)練卷積窗口的形狀,卷積窗口在offset field上滑動就呈現(xiàn)了卷積像素偏移的效果,達(dá)到采樣點(diǎn)優(yōu)化的效果,其中采樣公式為
其中p0指特征圖上的任意像素值,pn指在卷積核中位置相應(yīng)的值,Δpn指卷積核發(fā)生的位移量。接著,網(wǎng)絡(luò)按照不規(guī)則的偏移量(pn+Δpn)采樣;又因?yàn)棣n通常是不連續(xù)的,此處采用雙線性插值,插出每個點(diǎn)的像素值。
4.根據(jù)權(quán)利要求3所述的一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,所述offset field的大小與輸入層圖片大小一致。
5.根據(jù)權(quán)利要求1所述的一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,步驟S4所述ROI被分為3*3個bin。
6.根據(jù)權(quán)利要求1所述的一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,步驟S4所述池化操作中池化公式為
p0是ROI左上角的點(diǎn),nij(i行,j列)是固定大小bin里的總像素數(shù),同樣采用雙線性插值,插出每個點(diǎn)的像素值。
7.根據(jù)權(quán)利要求1所述的一種基于可變形卷積神經(jīng)網(wǎng)絡(luò)的紅外圖像物體識別方法,其特征在于,步驟S5所述目標(biāo)函數(shù)為計算所得值與目標(biāo)標(biāo)簽值的差的平方。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東電網(wǎng)有限責(zé)任公司;廣東電網(wǎng)有限責(zé)任公司珠海供電局,未經(jīng)廣東電網(wǎng)有限責(zé)任公司;廣東電網(wǎng)有限責(zé)任公司珠海供電局許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810316553.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測方法及檢測裝置
- 卷積神經(jīng)網(wǎng)絡(luò)的池化運(yùn)算裝置及方法
- 用于神經(jīng)網(wǎng)絡(luò)的池化裝置和池化方法
- 圖像數(shù)據(jù)處理方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 池化方法及裝置、池化系統(tǒng)、計算機(jī)可讀存儲介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)池化單元及池化計算方法
- 一種卷積神經(jīng)網(wǎng)絡(luò)的池化方法和裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)中的池化方法和池化模型
- 基于深度學(xué)習(xí)模型的圖像特征識別方法、裝置及存儲介質(zhì)
- 池化方法、裝置、設(shè)備和存儲介質(zhì)
- 特征圖的池化方法、數(shù)據(jù)處理方法和計算設(shè)備
- 基于紅外圖像直方圖的紅外圖像背景識別方法
- 一種單點(diǎn)紅外全景監(jiān)測電氣設(shè)備的方法及系統(tǒng)
- 圖像去噪方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 一種廣角紅外圖像優(yōu)化方法、系統(tǒng)及相關(guān)組件
- 深度圖像獲取方法及活體識別方法、設(shè)備、電路和介質(zhì)
- 紅外圖像降噪方法、裝置及設(shè)備
- 可見光圖像和紅外圖像融合方法、設(shè)備及可讀存儲介質(zhì)
- 紅外圖像融合方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 圖像校正方法及裝置
- 一種紅外圖像增強(qiáng)方法、裝置、設(shè)備及存儲介質(zhì)





