[發(fā)明專利]圖像處理方法、裝置及電子設(shè)備在審
| 申請?zhí)枺?/td> | 201910408167.4 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN110211017A | 公開(公告)日: | 2019-09-06 |
| 發(fā)明(設(shè)計)人: | 李華夏 | 申請(專利權(quán))人: | 北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司 |
| 主分類號: | G06T1/00 | 分類號: | G06T1/00;G06N3/04 |
| 代理公司: | 北京竹辰知識產(chǎn)權(quán)代理事務所(普通合伙) 11706 | 代理人: | 陳龍 |
| 地址: | 100041 北京市石景山區(qū)*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖像 卷積核 圖像處理 預設(shè) 裝置及電子設(shè)備 數(shù)據(jù)處理技術(shù) 數(shù)據(jù)處理能力 圖像處理算法 電子設(shè)備 系統(tǒng)資源 風格化 特征圖 求和 采樣 卷積 消耗 風格 應用 | ||
1.一種圖像處理方法,其特征在于,包括:
獲取具有預設(shè)尺寸大小的第一圖像;
對所述第一圖像執(zhí)行第一操作,以得到第二圖像,所述第一操作包括基于第一卷積核和第二卷積核,通過多個獨立的通道分別對所述第一圖像進行卷積求和操作,所述第一卷積核的長度和寬度均大于1,所述第二卷積核的長度和寬度均為1;
通過對所述第二圖像上的特征圖進行采樣,生成具有所述預設(shè)尺寸的第三圖像;
通過對所述第三圖像進行風格化處理,生成具有預設(shè)風格的第四圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過多個獨立的通道分別對所述第一圖像進行卷積求和操作,包括:
利用第一卷積核在所述多個獨立的通道內(nèi)對所述第一圖像執(zhí)行卷積操作,以得到第一計算結(jié)果;
利用第二卷積核對所述第一結(jié)算結(jié)果進行卷積操作,以得到第二計算結(jié)果;
將所述第二計算結(jié)果作為所述卷積求和操作的結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述第一圖像執(zhí)行第一操作,以得到第二圖像,還包括:
獲取所述多個通道中所述第一圖像的均值及方差;
基于所述均值和方差,對所述多個通道中每一通道中的所述第一圖像執(zhí)行歸一化處理;
對歸一化后的所述第一圖像執(zhí)行縮放和平移處理。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述第一圖像執(zhí)行第一操作,以得到第二圖像,還包括:
判斷所述第一圖像對應的矩陣中元素的值a是否大于零;
若否,則將k*a作為所述元素的值,其中k為預設(shè)系數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過對所述第二圖像上的特征圖進行采樣,生成具有所述預設(shè)尺寸的第三圖像,包括:
獲取針對所述第二圖像的所有卷積縮放因子;
基于所述卷積縮放因子,設(shè)置上采樣層;
利用所述上采樣層,形成所述第三圖像。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述利用所述上采樣層,形成所述第三圖像,包括:
利用所述采樣層對所述第二圖像進行插值操作,將插值之后的圖像作為所述第三圖像。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述通過對所述第三圖像進行風格化處理,生成具有預設(shè)風格的第四圖像,包括:
設(shè)置對所述第三圖像進行處理的多個卷積層和多個池化層;
確定所述第三圖像與風格化圖像在所述卷積層和池化層的特征表示;
基于所述特征表示,構(gòu)建最小化損失函數(shù);
基于所述最小化損失函數(shù),生成與所述第三圖像相對應的具有預設(shè)風格的第四圖像。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于:
所述池化層采用平均池化的方式對所述第三圖像進行處理。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
設(shè)置介于0和1之間的衰減系數(shù)b;
基于所述衰減系數(shù)b控制所述第一圖像的分辨率以及所述多個獨立的通道的個數(shù)。
10.一種圖像處理裝置,其特征在于,包括:
獲取模塊,用于獲取具有預設(shè)尺寸大小的第一圖像;
執(zhí)行模塊,用于對所述第一圖像執(zhí)行第一操作,以得到第二圖像,所述第一操作包括基于第一卷積核和第二卷積核,通過多個獨立的通道分別對所述第一圖像進行卷積求和操作,得到第二圖像,所述第一卷積核的長度和寬度均大于1,所述第二卷積核的長度和寬度均為1;
采樣模塊,用于通過對所述第二圖像上的特征圖進行采樣,生成具有所述預設(shè)尺寸的第三圖像;
生成模塊,用于通過對所述第三圖像進行風格化處理,生成具有預設(shè)風格的第四圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司,未經(jīng)北京字節(jié)跳動網(wǎng)絡(luò)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910408167.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 一種圖像超分辨率卷積神經(jīng)網(wǎng)絡(luò)加速計算方法
- 應用于神經(jīng)網(wǎng)絡(luò)的計算方法及計算裝置
- 神經(jīng)網(wǎng)絡(luò)模型的處理方法和裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)中的卷積核存儲方法及裝置
- 一種獲取專用卷積核的方法及裝置
- 深度神經(jīng)網(wǎng)絡(luò)裁剪方法、裝置及電子設(shè)備
- 卷積神經(jīng)網(wǎng)絡(luò)及基于卷積神經(jīng)網(wǎng)絡(luò)的圖像處理方法
- 神經(jīng)網(wǎng)絡(luò)壓縮、目標檢測、行駛控制方法以及裝置
- 一種基于卷積核復用的股票異動時序卷積自編碼訓練加速方法
- 用于卷積神經(jīng)網(wǎng)絡(luò)的卷積運算裝置





