[發(fā)明專利]基于圖像梯度的卷積方法、基于方向卷積的神經(jīng)網(wǎng)絡(luò)及分類方法有效
| 申請(qǐng)?zhí)枺?/td> | 202110477216.7 | 申請(qǐng)日: | 2021-04-29 |
| 公開(公告)號(hào): | CN113128614B | 公開(公告)日: | 2023-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 劉茂梅;匡乃亮;鐘升;唐磊;彭進(jìn)業(yè);羅迒哉 | 申請(qǐng)(專利權(quán))人: | 西安微電子技術(shù)研究所;西北大學(xué) |
| 主分類號(hào): | G06V10/82 | 分類號(hào): | G06V10/82;G06V10/44;G06V10/764;G06V10/774;G06N3/0464;G06N3/048;G06N3/047;G06N3/084 |
| 代理公司: | 西安通大專利代理有限責(zé)任公司 61200 | 代理人: | 崔方方 |
| 地址: | 710065 陜西*** | 國(guó)省代碼: | 陜西;61 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 圖像 梯度 卷積 方法 方向 神經(jīng)網(wǎng)絡(luò) 分類 | ||
本發(fā)明公開了基于圖像梯度的卷積方法、基于方向卷積的神經(jīng)網(wǎng)絡(luò)及分類方法,屬于卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域。本發(fā)明通過(guò)對(duì)圖像進(jìn)行基于圖像梯度信息的方向卷積以提取圖像特征。本發(fā)明的基于方向卷積的神經(jīng)網(wǎng)絡(luò),將顯式先驗(yàn)知識(shí)?圖像梯度信息嵌入深度學(xué)習(xí)模型中,有效降低網(wǎng)絡(luò)參數(shù)空間的規(guī)模,減少局部極值的問(wèn)題。本發(fā)明通過(guò)在淺層網(wǎng)絡(luò)的基礎(chǔ)上加入先驗(yàn)知識(shí)提升精度,用極少參數(shù)的較淺模型達(dá)到能與深度模型相比擬的圖像分類識(shí)別準(zhǔn)確率。引入方向卷積的小型化卷積神經(jīng)網(wǎng)絡(luò)模型在MNIST數(shù)據(jù)集上僅用0.062M的參數(shù)量就達(dá)到了與現(xiàn)有深度模型相比擬的分類精度,其參數(shù)量較經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)少了兩個(gè)數(shù)量級(jí)。
技術(shù)領(lǐng)域
本發(fā)明屬于卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域,尤其是基于圖像梯度的卷積方法、基于方向卷積的神經(jīng)網(wǎng)絡(luò)及分類方法。
背景技術(shù)
作為第四次工業(yè)革命的核心驅(qū)動(dòng)力,人工智能將像機(jī)械化,電氣化和信息化一樣,最終滲透各個(gè)行業(yè),并改變?nèi)藗兊纳睢W罱辏捎跈C(jī)器學(xué)習(xí)技術(shù)尤其是深度學(xué)習(xí)技術(shù)的興起,人工智能技術(shù)再次出現(xiàn)了前所未有的爆發(fā)性增長(zhǎng)。深度學(xué)習(xí)技術(shù)在各個(gè)領(lǐng)域全面開花,其中重點(diǎn)包括計(jì)算機(jī)視覺,模式識(shí)別,搜索技術(shù),自然語(yǔ)言處理和語(yǔ)音信號(hào)處理等領(lǐng)域。尤其在計(jì)算機(jī)視覺領(lǐng)域,深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)模型天然的強(qiáng)大數(shù)據(jù)表達(dá)能力,在當(dāng)下數(shù)據(jù)驅(qū)動(dòng)的大數(shù)據(jù)背景下已經(jīng)成為主流的特征學(xué)習(xí)方法,該方法在計(jì)算機(jī)視覺的核心任務(wù)圖像分類上已經(jīng)取得了巨大的成功。
目前深度學(xué)習(xí)模型為了追求圖像分類識(shí)別精度的提升,其改進(jìn)的主流思路是通過(guò)不斷加深模型的卷積層,提取更深層次的語(yǔ)義信息。然而模型加深的同時(shí)使得模型復(fù)雜度成幾何倍數(shù)的增長(zhǎng),模型參數(shù)量巨大,導(dǎo)致優(yōu)化困難、計(jì)算強(qiáng)度高、難以訓(xùn)練且難以移植到嵌入式設(shè)備等硬件計(jì)算資源有限的條件下。人工智能技術(shù)發(fā)展到落地應(yīng)用階段,需要將深度學(xué)習(xí)模型部署到嵌入式設(shè)備上,如何平衡深度學(xué)習(xí)模型的精度和效率成為了一個(gè)具有挑戰(zhàn)性的難題。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服上述現(xiàn)有技術(shù)的缺點(diǎn),提供基于圖像梯度的卷積方法、基于方向卷積的神經(jīng)網(wǎng)絡(luò)及分類方法。
為達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案予以實(shí)現(xiàn):
一種基于圖像梯度的卷積方法,對(duì)圖像進(jìn)行基于圖像梯度信息的方向卷積以提取圖像特征。
進(jìn)一步的,包括以下步驟:
步驟101、在采集的圖像上建立平面直角坐標(biāo)系,將采集的圖像轉(zhuǎn)化為灰度圖像,通過(guò)sobel算子提取灰度圖像橫向及縱向梯度信息,計(jì)算梯度的幅值和方向分別得到原始梯度幅值圖和原始梯度方向圖;
步驟102、將所述原始梯度方向圖做閾值化處理,得到圖像每點(diǎn)的梯度方向閾值;
步驟103、隨機(jī)初始化卷積核,再按照?qǐng)D像每點(diǎn)的梯度方向閾值對(duì)卷積核進(jìn)行方向化;
步驟104、將方向化后的卷積核與原始圖像進(jìn)行卷積,通過(guò)邊界填充操作保持卷積前后圖像分辨率不變。
進(jìn)一步的,步驟101中提取灰度圖像梯度信息的具體操作為:
sobel算子包含兩組3×3的矩陣,將sobel算子與灰度圖像作平面卷積,分別得出橫向及縱向的圖像梯度;
以A代表原始圖像,Gx為經(jīng)橫向卷積后的梯度值圖像,Gy代表經(jīng)縱向卷積后的梯度值圖像,其公式如下:
計(jì)算灰度圖像的梯度幅值圖G和梯度方向圖θ:
進(jìn)一步的,步驟102中將所述原始梯度方向圖做閾值化處理的具體操作為:
設(shè)A為原始圖像,分辨率為w×h,θ為原始梯度方向圖,C為閾值化后的梯度方向圖,則:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于西安微電子技術(shù)研究所;西北大學(xué),未經(jīng)西安微電子技術(shù)研究所;西北大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110477216.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 處理圖像的方法與裝置
- 一種磁共振成像系統(tǒng)的梯度磁場(chǎng)產(chǎn)生方法及其裝置
- 用于驅(qū)動(dòng)梯度線圈的梯度放大器系統(tǒng)及配置方法
- 一種基于相對(duì)梯度的圖像質(zhì)量客觀評(píng)價(jià)方法
- 一種優(yōu)化平衡穩(wěn)態(tài)自由進(jìn)動(dòng)序列的方法與裝置
- 一種重力梯度儀自標(biāo)定方法及離心梯度補(bǔ)償方法
- 梯度線圈及磁共振成像系統(tǒng)
- 一種磁場(chǎng)方向和梯度方向夾角可調(diào)的二維梯度磁場(chǎng)系統(tǒng)
- 一種聯(lián)邦推薦梯度獲取方法、裝置、智能終端及存儲(chǔ)介質(zhì)
- 一種超導(dǎo)全張量磁梯度探頭及超導(dǎo)全張量磁梯度測(cè)量系統(tǒng)
- 卷積運(yùn)算處理方法及相關(guān)產(chǎn)品
- 一種卷積神經(jīng)網(wǎng)絡(luò)的計(jì)算方法及系統(tǒng)
- 卷積運(yùn)算方法及系統(tǒng)
- 卷積運(yùn)算方法、裝置及系統(tǒng)
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法和圖像處理裝置
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 一種圖像處理方法、裝置以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運(yùn)算裝置
- 基于FPGA實(shí)現(xiàn)圖像識(shí)別的方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





