[發明專利]一種視頻圖像文字的檢測方法和裝置有效
| 申請號: | 201510091888.9 | 申請日: | 2015-02-28 |
| 公開(公告)號: | CN104766076B | 公開(公告)日: | 2019-01-01 |
| 發明(設計)人: | 許鵬;王濤;張彥剛 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/54 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 劉祥景 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 圖像 文字 檢測 方法 裝置 | ||
本發明實施例提供了一種視頻圖像文字的檢測方法和裝置,其中的方法具體包括:對視頻圖像進行文字檢測,確定所述視頻圖像的文本區域;利用所述視頻圖像的顏色信息對所述視頻圖像的文本區域進行文字和背景分割,得到二值化文字圖像;對所述二值化文字圖像進行過濾處理,得到過濾后的文字圖像。本發明實施例能夠提高視頻圖像文字檢測的效果。
技術領域
本發明涉及視頻文字處理技術領域,特別是涉及一種視頻圖像文字的檢測方法和裝置。
背景技術
隨著數字化網絡化的發展,數字圖像和視頻越來越多,圖片或視頻中的文字能夠提供直接的高層語義信息,因此開發視頻圖像文字的檢測技術,有助于對視頻圖像進行理解和管理。
現有的光學字符識別技術(Optical Character Recognition,OCR)主要針對的是圖像,尤其是照片中文字的檢測,并且對圖像預處理效果較為敏感。若想獲得較好的文字識別效果,必須通過圖像處理技術,將文字與背景清晰的分割出來。然而,對于視頻文字檢測,由于背景較為復雜,視頻壓縮造成的畫質損失,以及為了視覺效果在視頻文字的邊緣加入陰影等處理,使得通用的文字檢測技術如OCR,很難取得滿意的檢測效果。
此外,還有一個比較重要的影響因素是光照變化,因此必須考慮文字顏色的變化問題。而視頻文字一般為后期添加,雖然背景比較復雜,但是文字顏色比較均一,因此,若使用針對圖像的檢測方法,由于考慮了不必要的因素,會導致檢測精度有所降低。
發明內容
本發明實施例所要解決的技術問題是提供一種視頻圖像文字的檢測方法和裝置,能夠提高視頻圖像文字檢測的效果。
為了解決上述問題,本發明公開了一種視頻圖像文字的檢測方法,包括:
對視頻圖像進行文字檢測,確定所述視頻圖像的文本區域;
利用所述視頻圖像的顏色信息對所述視頻圖像的文本區域進行文字和背景分割,得到二值化文字圖像;
對所述二值化文字圖像進行過濾處理,得到過濾后的文字圖像。
優選地,所述確定所述視頻圖像的文本區域之后,還包括:
對所述視頻圖像的文本區域進行侵蝕處理,得到侵蝕后的文本區域。
優選地,所述利用所述視頻圖像的顏色信息對所述視頻圖像的文本區域進行文字和背景分割,得到二值化文字圖像的步驟,包括:
確定所述視頻圖像文字對應的三通道中心像素值;
判斷所述文本區域中每個像素點與所述中心像素值是否符合預置條件,若符合,則確定當前像素點為文字;若不符合,則確定當前像素點為背景。
優選地,所述確定所述視頻圖像文字對應的三通道中心像素值的步驟,包括:
利用所述文本區域作為掩板,從所述視頻圖像中過濾掉背景,得到文字;
提取所述文字的三通道像素值;
對每個通道提取的像素值進行排序,并依據排序結果確定中位數為所述文字對應的三通道中心像素值。
優選地,所述對所述二值化文字圖像進行過濾處理,得到過濾后的文字圖像的步驟,包括:
依據對所述文本區域分割出的文字,獲取所述文字的筆畫寬度信息以及所述文字的寬度信息;
依據所述文字的筆畫寬度信息和所述文字的寬度信息,對所述文本區域的文字進行切割緊縮處理;
對所述切割緊縮處理后的文本區域進行去噪處理,得到過濾后的文字圖像。
優選地,所述得到過濾后的文字圖像之后,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510091888.9/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





