[發明專利]一種文字區域確定方法和裝置在審
| 申請號: | 201810639618.0 | 申請日: | 2018-06-20 |
| 公開(公告)號: | CN110619257A | 公開(公告)日: | 2019-12-27 |
| 發明(設計)人: | 郭金馬;商磊 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00 |
| 代理公司: | 11227 北京集佳知識產權代理有限公司 | 代理人: | 郭化雨;朱靜 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻幀 文字區域 文本區域 文字內容 位置變化信息 待檢測區域 關鍵點 視頻 特征確定 計算量 中文字 申請 應用 | ||
本申請實施例公開了一種文字區域確定方法,應用于視頻中,方法包括:確定第一視頻幀中的文本區域;提取文本區域中關鍵點的第一特征;根據文本區域在第一視頻幀中的位置信息,確定第二視頻幀中的待檢測區域;提取待檢測區域中關鍵點的第二特征;根據第一特征和第二特征確定位置變化信息;根據文字內容在第一視頻幀中的位置信息和位置變化信息確定文字內容在第二視頻幀中的文字區域。可見,本申請可以實現對第二視頻幀中文字內容所在文字區域的確定,并且在確定過程中主要依據的是第一視頻幀和第二視頻幀中的文字內容,計算量相對較少,可以準確、快速的實現文字區域的確定,提高與視頻的同步程度。
技術領域
本申請涉及文字區域確定領域,特別是涉及一種文字區域確定方法和裝置。
背景技術
隨著圖像識別技術的發展,可以實現實時確定出視頻中具有文字內容的文字區域。在能夠實時確定出文字區域的前提下,可以在視頻中添加與該文字區域對應的內容,例如特效、翻譯等。
然而,目前并沒有專門針對視頻中文字區域確定的手段,只能通過傳統的物體追蹤方式來實時確定視頻中的文字區域。
傳統的物體追蹤方式需要關注視頻幀中包含的全部信息,故實現定位、追蹤視頻中文字區域需要付出高計算量的代價,計算速度較慢,難以實現與視頻同步。故此,基于物體追蹤方式確定出的文字區域添加相應內容時,添加內容的位置和視頻幀中文字區域的實際位置可能會有偏差,添加的內容也可能與文字區域不符。
發明內容
為了解決上述技術問題,本申請提供了一種文字區域確定方法,以希望可以準確、快速的實現文字區域的確定,提高與視頻的同步程度
本申請實施例公開了如下技術方案:
第一方面,本申請實施例提供了一種文字區域確定方法,應用于視頻中,所述方法包括:
確定第一視頻幀中的文本區域;
提取所述文本區域中關鍵點的第一特征;所述文本區域中關鍵點至少包括所述文本區域中文字內容的一部分,所述第一特征包括所述文本區域中關鍵點的位置特征和紋理特征;
根據所述文本區域在所述第一視頻幀中的位置信息,確定第二視頻幀中的待檢測區域,所述第二視頻幀為在所述視頻的播放順序下處于所述第一視頻幀之后的視頻幀;
提取所述待檢測區域中關鍵點的第二特征;所述第二特征包括所述待檢測區域中關鍵點的位置特征和紋理特征;
根據所述第一特征和所述第二特征確定位置變化信息,所述位置變化信息用于標識所述文字內容從所述第一視頻幀到所述第二視頻幀的位置變化;
根據所述文字內容在所述第一視頻幀中的位置信息和所述位置變化信息確定所述文字內容在所述第二視頻幀中的文字區域。
可選的,所述第一視頻幀與所述第二視頻幀為在所述視頻的播放順序下相鄰的視頻幀;
或者,
所述第一視頻幀為首張視頻幀,所述首張視頻幀為在所述視頻的播放順序下首次出現包括了所述文字內容的視頻幀。
可選的,若所述第一視頻幀與所述第二視頻幀為在所述視頻的播放順序下相鄰的視頻幀,則所述確定第一視頻幀中的文本區域,包括:
將第三視頻幀中的文本區域確定為所述第一視頻幀中的文本區域,所述第三視頻幀為在所述視頻的播放順序下與所述第一視頻幀相鄰、且處于所述第一視頻幀之后的視頻幀。
可選的,若所述第一視頻幀為首張視頻幀,則所述確定第一視頻幀中的文本區域,包括:
識別所述文字內容在所述第一視頻幀中的文字區域;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810639618.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:道路監控檢測方法及裝置
- 下一篇:一種基于高分辨率遙感影像的道路軌跡核查方法





