[發明專利]圖像模糊檢測模型的訓練方法、圖像模糊檢測方法及裝置有效
| 申請號: | 202110297735.5 | 申請日: | 2021-03-19 |
| 公開(公告)號: | CN113066024B | 公開(公告)日: | 2023-03-10 |
| 發明(設計)人: | 鞏佳超;戴宇榮;于冰 | 申請(專利權)人: | 北京達佳互聯信息技術有限公司 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/00;G06F16/735 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 王艷茹;蘇銀虹 |
| 地址: | 100085 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 模糊 檢測 模型 訓練 方法 裝置 | ||
本公開關于一種圖像模糊檢測模型的訓練方法、圖像模糊檢測方法及裝置。該圖像模糊檢測模型的訓練方法包括:獲取訓練圖像集,其中,訓練圖像集包括多個訓練圖像、每個訓練圖像標注的真實模糊分數;獲取訓練圖像的清晰度掩膜、文字區域掩膜和主要內容區域掩膜;將訓練圖像、訓練圖像的清晰度掩膜、訓練圖像的文字區域掩膜和訓練圖像的主要內容區域掩膜輸入到圖像模糊檢測模型中,獲取估計模糊分數;基于所述估計模糊分數和所述訓練圖像標注的真實模糊分數確定所述圖像模糊檢測模型的損失函數;根據所述損失函數調整所述圖像模糊檢測模型的參數,對所述圖像模糊檢測模型進行訓練。
技術領域
本公開涉及圖像處理領域,尤其涉及一種圖像模糊檢測模型的訓練方法、圖像模糊檢測方法及裝置。
背景技術
模糊是一種非常普遍的視頻圖像失真類型,具體表現為畫面中邊緣紋理不清晰,嚴重影響視頻圖像用戶的觀賞體驗。研究客觀高效的模糊檢測方法能夠自動化檢測視頻圖像的模糊程度,在生產階段,可以輔助生產者生成高質量的視頻圖像內容,在消費階段,可以幫助過濾低質視頻內容或者對低質視頻內容進行增強,從而在整體上保證了最終用戶的觀賞體驗。
目前,相關模糊檢測技術多適用于一次生產的圖像,一次生成的圖像即未處理過的圖像,如通過攝像機拍攝的原始圖片,但是,在短視頻領域,用戶大多會對一次生產的圖像內容做二次生產,比如增加一些文字描述、增加一些背景特效等,如圖1所示,這些文字和背景特效會嚴重干擾相關模糊檢測技術對二次生產的圖像的模糊程度的判斷,甚至會導致完全無法準確檢測二次生成的圖像的模糊程度。
發明內容
本公開提供一種圖像模糊檢測模型的訓練方法、圖像模糊檢測方法及裝置,以至少解決相關技術中的模糊檢測技術檢測二次生成的圖像的模糊程度不準確的問題。
根據本公開實施例的第一方面,提供一種圖像模糊檢測模型的訓練方法,包括:獲取訓練圖像集,其中,訓練圖像集包括多個訓練圖像、每個訓練圖像標注的真實模糊分數;根據訓練圖像集中的訓練圖像獲取訓練圖像的清晰度掩膜、文字區域掩膜和主要內容區域掩膜,其中,清晰度掩膜表示訓練圖像的清晰程度,文字區域掩膜表示訓練圖像中文字區域的位置,主要內容區域掩膜表示訓練圖像中主要內容區域的位置;將訓練圖像、訓練圖像的清晰度掩膜、訓練圖像的文字區域掩膜和訓練圖像的主要內容區域掩膜輸入到圖像模糊檢測模型中,獲取估計模糊分數;基于估計模糊分數和訓練圖像標注的真實模糊分數確定圖像模糊檢測模型的損失函數;根據損失函數調整圖像模糊檢測模型的參數,對圖像模糊檢測模型進行訓練。
可選地,基于估計模糊分數和訓練圖像標注的真實模糊分數確定圖像模糊檢測模型的損失函數包括:獲取估計模糊分數和訓練圖像標注的真實模糊分數的均方誤差;將均方誤差確定為圖像模糊檢測模型的損失函數。
可選地,圖像模糊檢測模型包括第一特征提取層、第二特征提取層、池化層與回歸層;其中,將訓練圖像、訓練圖像的清晰度掩膜、訓練圖像的文字區域掩膜和訓練圖像的主要內容區域掩膜輸入到圖像模糊檢測模型中,獲取估計模糊分數包括:將訓練圖像輸入第一特征提取層,獲取訓練圖像的第一特征,其中,所述第一特征提取層為所述圖像模糊檢測模型的前預定個數的卷積層;將第一特征與訓練圖像的清晰度掩膜、訓練圖像的文字區域掩膜相乘,獲得處理后的第一特征;將處理后的第一特征輸入第二特征提取層,獲取訓練圖像的第二特征,其中,所述第二特征提取層為所述圖像模糊檢測模型的前預定個數的卷積層和所述池化層之間的卷積層;將第二特征與訓練圖像的主要內容區域掩膜相乘,獲取處理后的第二特征;將處理后的第二特征輸入池化層和回歸層,得到訓練圖像的估計模糊分數。
可選地,將處理后的第二特征輸入池化層和回歸層,得到訓練圖像的估計模糊分數包括:將處理后的第二特征輸入池化層進行全局平均池化,得到第三特征;將第三特征與放大因子相乘,獲取第四特征,其中,放大因子為訓練圖像的主要內容區域掩膜中圖像的整體面積與主要內容區域面積的比值;將第四特征輸入回歸層進行回歸處理,得到訓練圖像的估計模糊分數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京達佳互聯信息技術有限公司,未經北京達佳互聯信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110297735.5/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





