[發明專利]一種視頻流文本識別方法和裝置在審

申請號：	201710050733.X	申請日：	2017-01-23
公開（公告）號：	CN108345886A	公開（公告）日：	2018-07-31
發明（設計）人：	許盛輝;馬龍;蘇雪峰	申請（專利權）人：	北京搜狗科技發展有限公司
主分類號：	G06K9/34	分類號：	G06K9/34;G06K9/46
代理公司：	北京潤澤恒知識產權代理有限公司 11319	代理人：	趙娟
地址：	100084 北京市海淀區中關***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	視頻流圖像文本區域文本文本識別方法和裝置視頻流預設時間間隔整幅圖像重疊信息申請圖像檢測
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種視頻流文本識別方法，其特征在于，包括：

按照預設時間間隔獲取視頻流圖像；

檢測所述視頻流圖像中的文本區域；

比較T(n)時刻的視頻流圖像的文本區域與T(n-1)時刻的視頻流圖像的文本區域；

根據比較結果，確定新增文本區域；

對所述新增文本區域進行文本識別，獲得新增識別文本；

將所述新增識別文本與針對T(n-1)時刻的視頻流圖像的識別文本組合為T(n)時刻的視頻流圖像的識別文本。

2.根據權利要求1所述的方法，其特征在于，所述根據比較結果，確定新增文本區域的步驟包括：

若所述比較結果為所述T(n)時刻的視頻流圖像的文本區域包含所述T(n-1)時刻的視頻流圖像的文本區域，則確定所述T(n)時刻的視頻流圖像的文本區域的重疊區域；

獲得第一圖像信息和第二圖像信息，所述第一圖像信息為所述T(n)時刻的視頻流圖像的文本區域的重疊區域的圖像信息，第二圖像信息為所述T(n-1)時刻的視頻流圖像的文本區域的圖像信息；

比較所述第一圖像信息和所述第二圖像信息；

若所述第一圖像信息與所述第二圖像信息相同，且所述T(n)時刻的視頻流圖像的文本區域具有超過所述T(n-1)時刻的視頻流圖像的文本區域的區域，則將所述T(n)時刻的視頻流圖像的文本區域超過所述T(n-1)時刻的視頻流圖像的文本區域的區域，確定為新增文本區域。

3.根據權利要求2所述的方法，其特征在于，還包括：

若所述第一圖像信息與第二圖像信息相同，且所述T(n)時刻的視頻流圖像的文本區域不具有超過所述T(n-1)時刻的視頻流圖像的文本區域的區域，則將所述T(n-1)時刻的視頻流圖像的識別文本，作為T(n)時刻的視頻流圖像的識別文本。

4.根據權利要求2或3所述的方法，其特征在于，還包括：

若所述第一圖像信息與第二圖像信息不相同，則對所述T(n)時刻的視頻流圖像的文本區域進行文本識別，獲得T(n)時刻的視頻流圖像的識別文本。

5.根據權利要求2所述的方法，其特征在于，還包括：

若所述比較結果為所述T(n)時刻的視頻流圖像的文本區域未包含所述T(n-1)時刻的視頻流圖像的文本區域，則對所述T(n)時刻的視頻流圖像的文本區域進行文本識別，獲得T(n)時刻的視頻流圖像的識別文本。

6.根據權利要求1所述的方法，其特征在于，所述檢測所述視頻流圖像中的文本區域的步驟包括：

對所述視頻流圖像進行二值化處理；

確定經過二值化處理的視頻流圖像中的連通域；

對所述經過二值化處理的視頻流圖像中的連通域進行合并，得到文本區域。

7.根據權利要求1所述的方法，其特征在于，所述對所述新增文本區域進行文本識別，獲得新增識別文本的步驟包括：

將所述新增文本區域輸入預置的深度神經元網絡；

將所述深度神經元網絡的輸出結果，作為新增識別文本。

8.根據權利要求4或5所述的方法，其特征在于，所述對所述T(n)時刻的視頻流圖像的文本區域進行文本識別，獲得T(n)時刻的視頻流圖像的識別文本的步驟包括：

對所述T(n)時刻的視頻流圖像進行二值化處理，確定經過二值化處理的視頻流圖像中的連通域；

對所述T(n)時刻的視頻流圖像的文本區域按照連通域進行切分，得到多個子區域；

將各個子區域輸入預置的深度神經元網絡；

將所述深度神經元網絡針對各個子區域的輸出結果，作為識別文本。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司，未經北京搜狗科技發展有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710050733.X/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種目標遮擋檢測的方法及裝置
下一篇：圖像語義分割模型的訓練方法及圖像語義分割方法

同類專利

專利分類

G 物理

G06 計算；推算；計數
G06K 數據識別；數據表示；記錄載體；記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形，例如，指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正，例如，用重復掃描圖形的方法
G06K9-18 .應用具有附加代碼標記或含有代碼標記的打印字符的，例如，由不同形狀的各個筆畫組成的，而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預處理，即無須判定關于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預處理作用的組合

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】