[發明專利]圖像去模糊模型的生成方法、圖像去模糊方法和電子設備有效
| 申請號: | 202110485596.9 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113205464B | 公開(公告)日: | 2023-05-05 |
| 發明(設計)人: | 黃宇飛;王巖;吳哲楠;李霄鵬;袁景偉;楊森;田寶亮;胡亞龍;蔡紅;王巖;安晟;郭彥宗 | 申請(專利權)人: | 作業幫教育科技(北京)有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06N3/0455;G06N3/0464;G06N3/08 |
| 代理公司: | 北京清誠知識產權代理有限公司 11691 | 代理人: | 喻穎 |
| 地址: | 100085 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 模糊 模型 生成 方法 電子設備 | ||
1.一種圖像去模糊模型的生成方法,其特征在于,包括如下步驟:
構建基于編碼-解碼結構的人工智能模型,所述人工智能模型包括編碼部分和解碼部分,其中編碼部分用于從輸入圖像中提取特征,解碼部分用于從提取的所述特征中還原出清晰的圖像;
采用模糊-清晰圖像對,對所述人工智能模型進行訓練,得到用于去除圖像模糊的圖像去模糊模型,其中,所述模糊-清晰圖像對包括清晰圖像和基于所述清晰圖像生成的模糊圖像;
在對所述人工智能模型進行訓練的步驟中,根據所述模糊圖像輸入所述人工智能模型后輸出的圖像和對應的所述清晰圖像之間的均方差,計算梯度損失,然后根據所述梯度損失更新所述人工智能模型;計算梯度損失的步驟包括:
將所述模糊-清晰圖像對中的模糊圖像輸入到所述人工智能模型中,輸出第一圖像;
將所述模糊-清晰圖像對中的清晰圖像作為第二圖像,計算所述第一圖像和第二圖像之間的第一均方差損失;
再將所述第一圖像和第二圖像分別送入隨機初始化的三層VGG網絡中,獲得對應的兩個輸出,計算所述兩個輸出的第二均方差損失;
然后根據所述第一均方差損失和第二均方差損失計算梯度損失;
所述三層VGG網絡為VGG16或VGG19,使用3×3卷積核尺寸和2×2最大池化尺寸。
2.根據權利要求1所述的方法,其特征在于,
所述人工智能模型包括深度學習神經網絡模型,所述深度學習神經網絡模型為卷積神經網絡模型或生成對抗網絡模型;
所述人工智能模型使用批歸一化和層歸一化進行歸一化。
3.根據權利要求1或2所述的方法,其特征在于,所述模糊-清晰圖像對通過如下步驟生成:
對滿足預設要求的清晰圖像進行模糊化處理,獲得與所述清晰圖像對應的模糊圖像,從而組成所述模糊-清晰圖像對;
所述模糊化處理包括:不同強度的高斯模糊處理和/或不同強度的運動模糊處理。
4.一種圖像去模糊的方法,其特征在于,采用如權利要求1至3中任一項所述的生成方法生成用于圖像去模糊的人工智能模型,并采用其對待處理的輸入圖像進行去模糊處理。
5.一種圖像去模糊模型的生成系統,其特征在于,包括:
輸入模塊,用于輸入訓練圖像;
模型搭建模塊,用于搭建基于編碼-解碼結構的人工智能模型;所述人工智能模型包括編碼部分和解碼部分,其中編碼部分從輸入圖像中提取特征,解碼部分從提取的特征中還原出清晰的圖像;
模型訓練模塊,用于采用模糊-清晰圖像對,對所述人工智能模型進行訓練;
所述模型訓練模塊根據梯度損失迭代更新所述人工智能模型;
計算所述梯度損失的步驟具體包括:
將模糊-清晰圖像對中的模糊圖像輸入到所述人工智能模型中,輸出第一圖像;
將模糊-清晰圖像對中的對應清晰圖像作為第二圖像,計算所述第一圖像和第二圖像之間的第一均方差損失;
再將所述第一圖像和第二圖像分別送入隨機初始化的三層VGG網絡中,獲得對應的兩個輸出,計算所述兩個輸出的第二均方差損失;
然后根據所述第一均方差損失和第二均方差損失計算梯度損失;
所述三層VGG網絡為VGG16或VGG19,使用3×3卷積核尺寸和2×2最大池化尺寸。
6.根據權利要求5所述的圖像去模糊模型的生成系統,其特征在于,
所述人工智能模型包括深度學習神經網絡模型;
所述深度學習神經網絡模型為卷積神經網絡模型或生成對抗網絡模型;
所述人工智能模型使用批歸一化和層歸一化進行歸一化;
所述模糊-清晰圖像對通過如下步驟生成:
對滿足預設要求的清晰圖像進行模糊化處理,獲得與所述清晰圖像對應的模糊圖像,從而組成所述模糊-清晰圖像對;
所述模糊化處理包括:不同強度的高斯模糊處理和/或不同強度的運動模糊處理。
7.一種電子設備,包括處理器和存儲器,所述存儲器用于存儲計算機可執行程序,其特征在于,當所述計算機可執行程序被所述處理器執行時,所述處理器執行如權利要求1至4中任一項所述的方法。
8.一種計算機可讀介質,存儲有計算機可執行程序,其特征在于,所述計算機可執行程序被執行時,實現如權利要求1至4中任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于作業幫教育科技(北京)有限公司,未經作業幫教育科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110485596.9/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





