[發明專利]面向幻燈片智能截圖的翻頁誤截識別方法有效
| 申請號: | 202110312746.6 | 申請日: | 2021-03-24 |
| 公開(公告)號: | CN113205100B | 公開(公告)日: | 2022-07-29 |
| 發明(設計)人: | 張暉;葉子皓;趙海濤;孫雁飛;朱洪波 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06V10/50 | 分類號: | G06V10/50;G06V10/75;G06K9/62 |
| 代理公司: | 南京經緯專利商標代理有限公司 32200 | 代理人: | 劉莎 |
| 地址: | 210003 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 幻燈片 智能 截圖 翻頁 識別 方法 | ||
1.面向幻燈片智能截圖的翻頁誤截識別方法,用于對重影誤截和拼接誤截兩種翻頁誤截情況進行識別,其特征在于,該方法包括:
(一)圖像X、E、Y是基于畫面差異度從視頻中識別并連續截取的三張幻燈片圖像,識別圖像E是否屬于重影誤截的具體步驟如下:
步驟1:根據圖像X、Y和E,計算透明度矩陣A;
步驟2:將透明度矩陣A中的無窮值inf修改為同符號的圖像像素的最大灰度值、非數值NaN修改為其他有限數的均值,得到修改后的矩陣A′;
步驟3:計算A′的均值μ和方差σ2;
其中n為A′的元素總數;
步驟4:若σ2小于預設第一閾值,則圖像E是由圖像X、Y重疊而成,屬于重影誤截,且重疊透明度為μ,否則圖像E不屬于重影誤截;
(二)圖像Z、F是基于畫面差異度從視頻中識別并連續截取的兩張幻燈片圖片,識別圖像F是否屬于拼接誤截的具體步驟如下:
步驟(1):在圖像Z中選取若干窗口,得到待匹配窗口集合{WZ};
步驟(2):將{WZ}中每個窗口與F進行匹配,得到匹配窗口對集合{(WZ,WF)};
步驟(3):根據{(WZ,WF)},計算得到位移向量集合{V},其中V表示起點為WZ、終點為WF的向量;
步驟(4):將{V}中相同的向量作為一個分組,每個分組內向量的數量作為直方高度,得到直方圖,若{V}中位移向量數量與待匹配窗口數之比超過預設第二閾值、且直方圖中最高的直方高度與{V}中位移向量數量之比超過預設第三閾值,則圖像F由圖像Z和其他圖像拼接而成,屬于拼接誤截,否則不屬于拼接誤截。
2.根據權利要求1所述的面向幻燈片智能截圖的翻頁誤截識別方法,其特征在于,步驟1中透明度矩陣A使用如下公式進行計算:
式中除號“-”表示按元素除。
3.根據權利要求1所述的面向幻燈片智能截圖的翻頁誤截識別方法,其特征在于,步驟2中使用如下公式將非數值NaN修改為其他有限數:
式中A(i,j)表示A中第i行第j列元素。
4.根據權利要求1所述的面向幻燈片智能截圖的翻頁誤截識別方法,其特征在于,步驟(1)中采用滑動窗口法選取窗口,并選取窗口內像素方差大于預設第四閾值的窗口作為待匹配窗口,其中窗口內像素方差的計算公式如下:
式中W(i,j)表示窗口W內坐標(i,j)的像素,μ(W)表示窗口W內像素均值,m表示窗口W內像素數量。
5.根據權利要求1所述的面向幻燈片智能截圖的翻頁誤截識別方法,其特征在于,步驟(2)中的匹配過程如下:
將WZ作為濾波矩陣在圖像F上逐像素移動并計算,得到差異圖DIFF:
DIFF(i,j)=diff(WZ,F[i:i+h,j:j+w])
其中DIFF(i,j)表示差異圖DIFF中坐標(i,j)的像素值,h和w為WZ的高和寬,F[i:i+h,j:j+w]表示圖像F中第i至i+h行、第j至j+w列范圍的子圖,diff(WZ,F(i:i+h,j:j+w))表示WZ和F(i:i+h,j:j+w)的差異值;
DIFF中最小像素值對應的位置即為WZ的匹配位置。
6.根據權利要求5所述的面向幻燈片智能截圖的翻頁誤截識別方法,其特征在于,diff(·,·)定義如下:
其中x和y表示同尺寸圖像,k為x或y的像素總數,rx、gx、bx分別為圖像x的紅、綠、藍通道圖像,ry、gy、by分別為圖像y的紅、綠、藍通道圖像。
7.根據權利要求1所述的面向幻燈片智能截圖的翻頁誤截識別方法,其特征在于,步驟(4)中拼接向量為直方圖中直方高度最大所代表的位移向量,Z按照拼接向量平移后將與F部分重合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110312746.6/1.html,轉載請聲明來源鉆瓜專利網。





