[發(fā)明專利]一種基于加載預(yù)訓(xùn)練卷積網(wǎng)絡(luò)的自動目標(biāo)識別方法在審
| 申請?zhí)枺?/td> | 201710999215.2 | 申請日: | 2017-10-20 |
| 公開(公告)號: | CN107545257A | 公開(公告)日: | 2018-01-05 |
| 發(fā)明(設(shè)計)人: | 夏春秋 | 申請(專利權(quán))人: | 深圳市唯特視科技有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518057 廣東省深圳市高新技術(shù)產(chǎn)業(yè)園*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 加載 訓(xùn)練 卷積 網(wǎng)絡(luò) 自動 目標(biāo) 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及目標(biāo)識別領(lǐng)域,尤其是涉及了一種基于加載預(yù)訓(xùn)練卷積網(wǎng)絡(luò)的自動目標(biāo)識別方法。
背景技術(shù)
自動目標(biāo)識別方法,是一種利用人工智能技術(shù)實現(xiàn)對機器傳感器獲得的目標(biāo)特征進行分類和智能識別的技術(shù),是模式識別的延伸發(fā)展,也是近年來的研究熱點之一。作為武器裝備智能化的核心技術(shù)之一,自動目標(biāo)識別在軍事作戰(zhàn)領(lǐng)域中應(yīng)用極為廣泛,為信息化戰(zhàn)爭中的目標(biāo)探測、偵察監(jiān)視和精確制導(dǎo)提供了有力支持。但隨著民用科技的發(fā)展,這些技術(shù)也很好地在日常生活中為人們服務(wù)。例如交通設(shè)施中,可以自動識別特定車道的車輛是否符合要求;在動物繁殖領(lǐng)域中,可以自動監(jiān)控廣闊地帶動物物種的出現(xiàn)與頻率;在機器人導(dǎo)航中,可以自動判斷傳感器接收的信號是否符合安全行駛;在現(xiàn)代醫(yī)療診斷中,可以提前判別病患體中腫狀物的類型,進而提高治愈率。如上等等,都是具有極大應(yīng)用價值和開發(fā)空間。
傳感器接收的圖像本身的噪聲難以剔除,以及新類型目標(biāo)的先驗知識缺失,都會給目標(biāo)的自動識別帶來難度。但除了以上所述,另外還存在樣本數(shù)據(jù)少、訓(xùn)練速度慢等困難需要克服,因此如何在有限數(shù)據(jù)中提煉出可靠的分類算法或訓(xùn)練可靠的分類器,是需要解決的問題。
本發(fā)明提出了一種基于卷積網(wǎng)絡(luò)提取特征進行傳統(tǒng)分類的新框架。使用已訓(xùn)練好的卷積網(wǎng)絡(luò)框架進行模塊拆分,在保留權(quán)重的前提下進行根據(jù)目標(biāo)識別任務(wù)進行重構(gòu),同時保留原全連接層的最后一層作為提取的特征,貼上響應(yīng)的標(biāo)簽后,送往基于高斯核的支持向量機進行訓(xùn)練測試。本發(fā)明可以處理只有小樣本數(shù)據(jù)庫的目標(biāo)形態(tài)識別,提供一個網(wǎng)絡(luò)遷移框架進行權(quán)重的保留與微調(diào),同時提高了目標(biāo)識別任務(wù)的訓(xùn)練速度和可遷移性。
發(fā)明內(nèi)容
針對解決在小樣本數(shù)據(jù)量中進行目標(biāo)識別任務(wù)的問題,本發(fā)明的目的在于提供一種基于加載預(yù)訓(xùn)練卷積網(wǎng)絡(luò)的自動目標(biāo)識別方法,提出了一種基于卷積網(wǎng)絡(luò)提取特征進行傳統(tǒng)分類的新框架。
為解決上述問題,本發(fā)明提供一種基于加載預(yù)訓(xùn)練卷積網(wǎng)絡(luò)的自動目標(biāo)識別方法,其主要內(nèi)容包括:
(一)網(wǎng)絡(luò)重構(gòu);
(二)網(wǎng)絡(luò)特征合成
(三)分類器轉(zhuǎn)換;
(四)網(wǎng)絡(luò)模型微調(diào)。
其中,所述的網(wǎng)絡(luò)重構(gòu),包括網(wǎng)絡(luò)結(jié)構(gòu)拆分重構(gòu)和權(quán)重預(yù)加載。
所述的網(wǎng)絡(luò)結(jié)構(gòu)拆分重構(gòu),對現(xiàn)有典型的用于圖像分類的學(xué)習(xí)網(wǎng)絡(luò)(如VGG19,由若干個卷積模塊組成)進行功能和架構(gòu)拆分,再根據(jù)自動目標(biāo)識別所需的功能層進行重構(gòu),具體為:
(1)將一般網(wǎng)絡(luò)視作“輸入層、卷積層(多層)、全連接層和輸出層”;
(2)選取具有前向傳播能力的結(jié)構(gòu)層進行重構(gòu);
(3)去掉最后一層輸出層;
(4)根據(jù)目標(biāo)識別任務(wù)的樣本數(shù)量進行卷積網(wǎng)絡(luò)的層數(shù)壓縮;
(5)全連接層中保留倒數(shù)第一層作為特征選取。
所述的層數(shù)壓縮,在原有卷積網(wǎng)絡(luò)造成冗長訓(xùn)練時,截取完整的卷積功能模塊,組成更少層次的卷積網(wǎng)絡(luò),并保留最終的輸出層。
所述的權(quán)重預(yù)加載,在進行網(wǎng)絡(luò)結(jié)構(gòu)拆分重構(gòu)時,原有已訓(xùn)練好的模型不進行清零操作,即不進行初始化操作,所得權(quán)重與該卷積網(wǎng)絡(luò)最后一次訓(xùn)練所改變的權(quán)重值完全保持一致。
所述的網(wǎng)絡(luò)特征合成,在倒數(shù)第一層的全連接層中保留神經(jīng)元的權(quán)重與偏置,與新樣本中的輸入數(shù)據(jù)相乘,得到新的數(shù)據(jù)即為合成的網(wǎng)絡(luò)特征,具有可分性。
所述的分類器轉(zhuǎn)換,包括更改標(biāo)簽設(shè)定和分類器設(shè)定。
所述的更改標(biāo)簽設(shè)定,通過兩個步驟完成從卷積網(wǎng)絡(luò)特征向傳統(tǒng)分類器特征歸類的改變:
(1)去掉原卷積網(wǎng)絡(luò)的概率計算模塊;
(2)將原有的分類計算中的標(biāo)簽,重新按順序貼到相應(yīng)類別中,即按照原始標(biāo)簽重新劃分數(shù)據(jù)。
所述的分類器設(shè)定,使用基于高斯核的支持向量機作為分類器,使用小樣本對懲罰系數(shù)C和核函數(shù)參量G分別從-8到8(步長為2)進行網(wǎng)格搜索,確定最優(yōu)的C和G后,對全部數(shù)據(jù)進行一次訓(xùn)練,得到的結(jié)果即為分類結(jié)果。
所述的網(wǎng)絡(luò)模型微調(diào),基于不同的分類識別任務(wù),其權(quán)重遷移過程中不具有全部適應(yīng)性,因此在輸出到分類特征前,使用反向傳播算法對學(xué)習(xí)到的特征返回到輸入圖像層進行對比,然后再通過前向傳播到最后分類特征進行調(diào)整,這樣一次循環(huán)完成即為一個模型微調(diào),直到分類結(jié)果進行收斂后,微調(diào)停止。
附圖說明
圖1是本發(fā)明一種基于加載預(yù)訓(xùn)練卷積網(wǎng)絡(luò)的自動目標(biāo)識別方法的系統(tǒng)流程圖。
圖2是本發(fā)明一種基于加載預(yù)訓(xùn)練卷積網(wǎng)絡(luò)的自動目標(biāo)識別方法的效果圖。
具體實施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市唯特視科技有限公司,未經(jīng)深圳市唯特視科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710999215.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:地址分配方法和裝置
- 下一篇:一種語音處理方法及終端
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 卷積運算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計算方法及系統(tǒng)
- 卷積運算方法及系統(tǒng)
- 卷積運算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計算機存儲介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置
- 基于FPGA實現(xiàn)圖像識別的方法、裝置、設(shè)備及存儲介質(zhì)





