[發(fā)明專利]基于分解徑向?qū)ΨQ卷積核的卷積優(yōu)化方法、裝置、終端設(shè)備及計算機(jī)可讀存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201810852407.5 | 申請日: | 2018-07-27 |
| 公開(公告)號: | CN109034249B | 公開(公告)日: | 2021-08-06 |
| 發(fā)明(設(shè)計)人: | 黃文愷;胡凌愷;薛義豪;倪皓舟;彭廣龍;何杰賢;吳羽 | 申請(專利權(quán))人: | 廣州大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/54 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 顏希文;麥小嬋 |
| 地址: | 510000 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 分解 徑向 對稱 卷積 優(yōu)化 方法 裝置 終端設(shè)備 計算機(jī) 可讀 存儲 介質(zhì) | ||
本發(fā)明公開了基于分解徑向?qū)ΨQ卷積核的卷積優(yōu)化方法、裝置、終端設(shè)備及計算機(jī)可讀存儲介質(zhì),所述方法包括:輸入待識別圖像,并對所述待識別圖像進(jìn)行預(yù)處理;分別利用預(yù)先分解m*m徑向?qū)ΨQ卷積核得到的1個1*1的卷積核和(m?1)/2個1*m(m=2k+3,k∈N)的卷積核,對經(jīng)過預(yù)處理的待識別圖像進(jìn)行卷積,得到1個1*1的第一特征圖和(m?1)/2個1*m(m=2k+3,k∈N)的第二特征圖;進(jìn)一步對第二特征圖進(jìn)行卷積,得到第三特征圖;對第一特征圖和(第三特征圖進(jìn)行求和,得到目標(biāo)特征圖,并輸出所述目標(biāo)特征圖。本發(fā)明通過在降低徑向?qū)ΨQ卷積核計算量的基礎(chǔ)上降低參數(shù)量,進(jìn)而達(dá)到對卷積進(jìn)行優(yōu)化的目的。
技術(shù)領(lǐng)域
本發(fā)明涉及神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及基于分解徑向?qū)ΨQ卷積核的卷積優(yōu)化方法、裝置、終端設(shè)備及計算機(jī)可讀存儲介質(zhì)。
背景技術(shù)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是近幾年圖像處理與識別領(lǐng)域最常用的一種神經(jīng)網(wǎng)絡(luò),它具有較好的特征分類效果和易于高維數(shù)據(jù)處理的優(yōu)點(diǎn),但是卷積神經(jīng)網(wǎng)絡(luò)容易出現(xiàn)過擬合現(xiàn)象,且卷積神經(jīng)網(wǎng)絡(luò)的魯棒性較低,因此,在傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建中,常常會將原始訓(xùn)練集圖片進(jìn)行鏡像以及大角度的旋轉(zhuǎn)處理,以增加卷積神經(jīng)網(wǎng)絡(luò)的魯棒性,使得卷積神經(jīng)網(wǎng)絡(luò)可識別任意角度的圖片;但是這種傳統(tǒng)方法卻會產(chǎn)生增大數(shù)據(jù)量,使得訓(xùn)練時間增長的問題。
現(xiàn)有技術(shù)中,針對所述傳統(tǒng)方法存在的問題,通常采用具有徑向?qū)ΨQ性質(zhì)的卷積核,其在卷積神經(jīng)網(wǎng)絡(luò)的使用中能夠提供良好的魯棒性,且能夠降低出現(xiàn)過擬合現(xiàn)象的可能性。然而所述徑向?qū)ΨQ卷積核在運(yùn)算中計算量過大,現(xiàn)有的針對該計算量過大的問題的技術(shù)方案主要是,在卷積神經(jīng)網(wǎng)絡(luò)中采用卷積核裁剪法和多通道卷積優(yōu)化算法。但是,發(fā)明人在實(shí)施現(xiàn)有技術(shù)方案時,發(fā)現(xiàn)這些優(yōu)化算法在使用中會出現(xiàn)參數(shù)量過大的問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題在于,提供基于分解徑向?qū)ΨQ卷積核的卷積優(yōu)化方法、裝置、終端設(shè)備及計算機(jī)可讀存儲介質(zhì),通過在降低徑向?qū)ΨQ卷積核計算量的基礎(chǔ)上降低參數(shù)量,進(jìn)而達(dá)到對卷積進(jìn)行優(yōu)化的目的。
為了解決上述技術(shù)問題,本發(fā)明的一個實(shí)施例提供了基于分解徑向?qū)ΨQ卷積核的卷積優(yōu)化方法,適于在計算設(shè)備中執(zhí)行,包括如下步驟:
輸入待識別圖像,并對所述待識別圖像進(jìn)行預(yù)處理;
分別利用預(yù)先分解m*m徑向?qū)ΨQ卷積核得到的1個1*1的卷積核和(m-1)/2 個1*m(m=2k+3,k∈N)的卷積核,對經(jīng)過預(yù)處理的待識別圖像進(jìn)行卷積,得到1 個1*1的第一特征圖和(m-1)/2個1*m(m=2k+3,k∈N)的第二特征圖;再利用預(yù)先分解m*m徑向?qū)ΨQ卷積核得到的與(m-1)/2個1*m(m=2k+3,k∈N)的卷積核一一對應(yīng)的(m-1)/2個m*1(m=2k+3,k∈N)的卷積核,對(m-1)/2個1*m(m=2k+3,k∈N) 的第二特征圖進(jìn)行卷積,得到(m-1)/2個m*1(m=2k+3,k∈N)的第三特征圖;
對1個1*1的第一特征圖和(m-1)/2個m*1(m=2k+3,k∈N)的第三特征圖進(jìn)行求和,得到目標(biāo)特征圖,并輸出所述目標(biāo)特征圖。
進(jìn)一步地,所述對所述待識別圖像進(jìn)行預(yù)處理,具體為:
根據(jù)預(yù)設(shè)參數(shù),對所述待識圖像進(jìn)行隨機(jī)拉伸和明暗調(diào)整,并加入特定的高斯噪聲;
進(jìn)一步地,根據(jù)卷積處理的要求,對所述待識圖像進(jìn)行0~π/2角度的旋轉(zhuǎn)和切割。
進(jìn)一步地,每一個卷積核的卷積核矩陣A滿足如下公式:
其中,
進(jìn)一步地,每一個m*1(m=2k+3,k∈N)的卷積核與對應(yīng)的一個m*1(m=2k+3,k ∈N)的卷積核組成一個等比對稱向量組,即ISV,具體的:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州大學(xué),未經(jīng)廣州大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810852407.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





