[發明專利]基于特征摘要圖的視頻中的戶外場景文本自動獲取方法有效
| 申請號: | 201711381971.5 | 申請日: | 2017-12-20 |
| 公開(公告)號: | CN108038458B | 公開(公告)日: | 2021-04-09 |
| 發明(設計)人: | 黃曉冬;王勤 | 申請(專利權)人: | 首都師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/46;G06K9/62 |
| 代理公司: | 北京德琦知識產權代理有限公司 11018 | 代理人: | 夏憲富 |
| 地址: | 100048 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 摘要 視頻 中的 戶外 場景 文本 自動 獲取 方法 | ||
1.一種基于特征摘要圖的視頻中的戶外場景文本自動獲取方法,其特征在于:該方法包括下列操作步驟:
步驟1,獲取場景文本的視頻幀圖像,并基于該視頻幀圖像的紅綠藍RGB色彩空間生成視頻幀特征摘要圖:首先在RGB色彩空間上分別提取包括水平方向、垂直方向、45度方向和135度方向的四個卷積圖,得到用于表征RGB色彩空間的四個方向特征向量;再將該四個方向特征向量分別進行兩兩向量的乘積運算,以獲得分別代表不同方向視頻幀的十個顯著圖;然后對該不同方向的十個顯著圖進行融合計算,得到視頻幀特征摘要圖;
步驟2,自動獲取場景文本:首先基于該視頻幀特征摘要圖的色彩空間HSV采用K均值聚類算法進行K均值顏色聚類計算,將該視頻幀摘要圖細分為分別表示背景、前景文字字符、字符輪廓和噪音的四個區域的四類結果;再對該四類結果分別進行連通域分析,刪除背景和噪音兩個區域,獲取最終的場景文本;
其中,所述得到用于表征RGB色彩空間的四個方向特征向量包括:分別在紅色通道上分別提取水平方向卷積圖Rh、垂直方向卷積圖Rv、45度方向卷積圖Rl和135度方向卷積圖Rr,在綠色通道上分別提取水平方向卷積圖Gh、垂直方向卷積圖Gv、45度方向卷積圖Gl和135度方向卷積圖Gr,在藍色通道上分別提取水平方向卷積圖Bh、垂直方向卷積圖Bv、45度方向卷積圖Bl和135度方向卷積圖Br;再將上述各個方向卷積圖按照RGB色彩空間排列,得到用于表征RGB色彩空間的四個方向特征向量:水平方向特征向量H={Rh,Gh,Bh},垂直方向特征向量V={Rv,Gv,Bv},45度方向特征向量L={Rl,Gl,Bl},135度方向特征向量R={Rr Gr,Br}。
2.根據權利要求1所述的方法,其特征在于:所述在RGB色彩空間上分別提取的包括水平方向、垂直方向、45度方向和135度方向的四個卷積圖中,水平方向卷積圖采用的水平方向卷積核是索貝爾Sobel算子中計算水平方向微分的計算模板:垂直方向卷積圖采用的垂直方向卷積核是Sobel算子中計算垂直方向微分的計算模板:45度方向卷積圖采用的45度方向卷積核是計算45度方向微分的計算模板:135度方向卷積圖采用的135度方向卷積核是計算135度方向微分的計算模板:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于首都師范大學,未經首都師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711381971.5/1.html,轉載請聲明來源鉆瓜專利網。





