[發明專利]一種屏幕內容圖像質量評估方法有效
| 申請號: | 202110831904.9 | 申請日: | 2021-07-22 |
| 公開(公告)號: | CN113610862B | 公開(公告)日: | 2023-08-01 |
| 發明(設計)人: | 王同罕;廖靜;何月順;周書民;徐洪珍;李祥;何劍鋒;賈惠珍;李廣 | 申請(專利權)人: | 東華理工大學 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/136;G06N20/10 |
| 代理公司: | 南昌卓爾精誠專利代理事務所(普通合伙) 36133 | 代理人: | 賀楠 |
| 地址: | 344000*** | 國省代碼: | 江西;36 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 屏幕 內容 圖像 質量 評估 方法 | ||
1.一種屏幕內容圖像質量評估方法,其特征在于,包括以下步驟:
(1)構建屏幕內容圖像數據庫;
(2)對屏幕內容圖像執行文本分割函數,將屏幕內容圖像分割為文本區域和圖像區域;
(3)對圖像區域執行圖像區域質量評估函數,提取圖像區域的紋理特征和圖像結構特征;
(4)對文本區域執行文本區域質量評估函數,提取文本區域的清晰度和文本結構特征;
(5)隨機選取一千個屏幕內容圖像數據庫的屏幕內容圖像,將一千個屏幕內容圖像的紋理特征、圖像結構特征、清晰度、文本結構特征和主觀質量分數輸入LIBSVM軟件中進行訓練,獲取質量評估模型;
(6)輸入待評估的屏幕內容圖像,經過步驟(2)、(3)和(4)處理后,將所述待評估的屏幕內容圖像的紋理特征、圖像結構特征、清晰度、文本結構特征和主觀質量分數輸入質量評估模型中,獲取質量分數;
其中,所述步驟(2)具體包括以下步驟:首先,動態的設置第一閾值,通過找出所有最大穩定極值區域,其中,Qi表示第一閾值為i時的某一連通區域,Δ表示微小的第一閾值變化,v(i)為第一閾值是i時的區域Qi的變化率,當v(i)小于給定第一閾值時認為該區域Qi為最大穩定極值區域;其次,設定與區域具有相同標準二階中心矩的橢圓的離心率的第二閾值、歐拉數的第三閾值、區域中像素數與邊界框中總像素的比率的第四閾值和第五閾值、凸包中區域內像素所占的比例的第六閾值,計算最大穩定極值區域的與區域具有相同標準二階中心矩的橢圓的離心率、歐拉數、區域中像素數與邊界框中總像素的比率、凸包中區域內像素所占的比例,當計算得出的與區域具有相同標準二階中心矩的橢圓的離心率大于第二與之、歐拉數小于第三閾值、區域中像素數與邊界框中總像素的比率在下于第四閾值或大于第五閾值、凸包中區域內像素所占的比例限于第六閾值時,可確定第一文本區域;然后,設定筆畫寬度變化率的第七閾值,計算第一文本區域的筆畫寬度變化率,當變化率大于第七閾值時,可確認第二文本區域,最后,提取并合并所有最大穩定極值區域的第二文本區域作為文本區域,將屏幕內容圖像的剩余區域合并作為圖像區域;
所述步驟(3)具體包括以下步驟:
S1:提取圖像區域的紋理特征,首先,通過Scharr算子計算出圖像區域的梯度圖,并對梯度圖進行歸一化:其中[]為取整運算,gmax為原梯度值的最大值,L為歸一化后的最大灰度級數;接著,對圖像區域的灰度圖進行歸一化:fmax是原灰度圖中的灰度最大值;然后,構建灰度-梯度共生矩陣M,水平遞增為梯度值,垂直遞增為灰度值,原點位于矩陣的坐上頂點處;M定義為M(i,j)=#{(m,n)|g(m,n)=i,f(m,n)=j,m=0,1,2...M-1,n=0,1,2...N-1},其中M×N為梯度和灰度圖的大小,#{}表示為集合中元素的個數,最后,提取灰度-梯度共生矩陣的統計特征包括:梯度熵灰度熵能量灰度均值梯度均值梯度標準差灰度標準差作為圖像區域的紋理特征,其中,(i,j)出現的總次數歸一化為出現的概率P(i,j);
S2:提取圖像區域的圖像結構特征,首先,對圖像區域進行分塊,分為大小相等的n×n個局部圖像塊,并對每個圖像塊進行局部二維離散余弦變換,以得到DCT系數,接著使用廣義高斯分布模型對DCT系數進行擬合,擬合后會得到圖像塊的形狀參數γ,將最低的10%的γ值的平均值作為第一結構特征,所有γ值的均值作為第二結構特征,然后,計算頻率變化系數其中σ|X|是塊的方差,μ|X|是塊的均值,取的最大的10%的均值作為第三結構特征,以及將的均值作為第四結構特征,之后,為從局部圖像塊中獲取方向信息,將DCT系數塊分為低、中、高3個頻帶,然后計算每個頻帶中的平均能量:其中n為正整數,σn為頻帶n的方差,計算子帶能量之比:取Rn的最高的10%的均值作為第五結構特征,取Rn的均值作為第六結構特征,最后,為了提取方向信息,根據徑向頻率變化的垂直方向沿3個方向將DCT系數分為3個部分,接著計算在3個方向的頻率變化系數計算的方差,取方差最高的10%均值作為第七結構特征,以及將的方差的均值作為第八結構特征。
2.根據權利要求1所述的一種屏幕內容圖像質量評估方法,其特征在于,所述步驟(4)具體包括以下步驟:
S1:提取文本區域的清晰度,首先,在x和y方向進行濾波,并對濾波后的圖像比上濾波圖像中的最大值進行歸一化操作,歸一化后的像素點值大于預先設定的閾值時,則該像素點作為可能的邊緣像素,接著分別在水平方向和垂直方向計算中值濾波圖像差的差ΔDoM,水平方向:ΔDoMx(i,j)=[IM(i+2,j)-IM(i,j)]-[IM(i,j)-IM(i-2,j)],垂直方向:ΔDoMy(i,j)=[IM(i,j+2)-IM(i,j)]-[IM(i,j)-IM(i,j-2)],其中,IM(i,j)是中值濾波圖像在像素(i,j)處的灰度值,使用偏差為2的差異,在像素(i,j)處的x方向的清晰度定義為:在y方向的清晰度計算方式同理,其中,∑i-w≤k≤i-w|ΔDoMx(k,j)|表明在大小為2w+1的窗口上求和ΔDoM,對邊緣處的對比度進行歸一化,∑i-w≤k≤i+w|I(k,j)-I(k-1,j)|為在窗口大小為2w+1上的對比度,當Sx(i,j)大于預設閾值時則(i,j)處的像素點為清晰的,最后,該區域的圖像的清晰度定義為:其中:#sharpPixels為清晰的像素點數,#edgePixels為邊緣像素點數;
S2:提取文本區域的文本結構特征,首先,計算文本區域的梯度圖GM,圖像像素點(i,j)處的梯度計算如下:其中h代表梯度算子,代表卷積運算;接著在梯度圖上計算旋轉不變均勻的局部二值模式LBP,其中,Δ表示統一度量,U代表相鄰像素數,S代表領域的半徑值,ρ定義為閾值函數,Gk,GC表示為中心坐標及其鄰域的GM值,接著計算GMLBP直方圖,觀察到GMLBP可以包含U+2個不同的模式,這些模式可以組合到直方圖的一個bin中,將U設置為8,因此直方圖共有10個bin,并在三個尺度下分別計算,所述三個尺度為原始圖像,下采樣因子為2采樣后的圖像,下采樣因子為4采樣后的圖像,因此共提取30個文本結構特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東華理工大學,未經東華理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110831904.9/1.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





