[發明專利]一種基于角點檢測的視頻字幕區域定位方法有效
| 申請號: | 201710707407.1 | 申請日: | 2017-08-17 |
| 公開(公告)號: | CN107302718B | 公開(公告)日: | 2019-12-10 |
| 發明(設計)人: | 霍華;呂靖;常國沁;李寧波 | 申請(專利權)人: | 河南科技大學 |
| 主分類號: | H04N21/431 | 分類號: | H04N21/431;H04N21/488 |
| 代理公司: | 41120 洛陽公信知識產權事務所(普通合伙) | 代理人: | 宋晨煒 |
| 地址: | 471000 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 檢測 視頻 字幕 區域 定位 方法 | ||
1.一種基于角點檢測的視頻字幕區域定位方法,其特征在于:包括以下步驟:
步驟一、對待定位的視頻幀進行角點檢測,得到每一幀圖片的角點,將角點在水平和豎直方向上進行投影,得到投影直方圖;
步驟二、對步驟一 得到的投影直方圖進行優化處理,具體方法為:
(1)對投影直方圖的行進行合并:即將高度為Ry的新聞視頻圖片分為Ry行,將相鄰若干行上的角點數進行加權至其中一行并保留,同時刪去此組的其他行,若n為所要合并的行數,合并后共有m組,則假設每一行的角點數分別為則合并后的m個行上最終的角點數N(ld)可由公式(1)得到:
其中,d=1,2,…m,l為行符號,ld表示第d行;
同理,用同樣的方法對列進行合并,得到合并后每一列的角點數N(ke),其中,e表示合并后的第e列,k為列符號,ke表示第k列;
(2)采用公式(2)對合并后的投影直方圖進行相對寬度處理:
其中,N(lh)為合并后每一行的相對角點數,Rx為原新聞視頻圖片的寬度,Wr是一個抑制值;
(3)采用公式(3)對投影圖進行相對高度處理:
其中,N(kw)為合并后每一列的相對角點數,Ry為原新聞視頻圖片的高度,Wc是一個抑制值;
步驟三、利用步驟二優化處理后的投影直方圖對字幕區域進行定位,得到定位區域D1,D2,…Ds,具體方法為:
(1)設置行閾值t1,定位上下邊界:經過優化處理后的的投影直方圖的高度為h,每一行投影為l1,l2,…lh,每一行投影的相對角點數為N(l1),N(l2),…N(lh),對這些角點數進行檢測,若檢測到行li滿足公式(4):
則行li為一個上邊界,繼續進行檢測,知道檢測到行lj滿足公式(5):
則行lj即為與上邊界li對應的下邊界,其中i和j滿足條件
(2)設置列閾值t2,定位左右邊界:經過優化處理后的投影直方圖的寬度為w,與定位上下邊界相同,若列ki和列kj分別滿足公式(6)和(7),則ki和kj分別為當前上下邊界內的一組左右邊界;
其中N(ki)和N(kj)是列ki和列kj的相對角點數,i和j滿足條件
(3)確定上下邊界和左右邊界后,即可確定字幕定位區域D1,D2,…Ds;
步驟四、對整個區域被錯誤切分為多個部分的細碎區域進行融合;
步驟五、獲得最終的文字區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南科技大學,未經河南科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710707407.1/1.html,轉載請聲明來源鉆瓜專利網。





