[發明專利]一種在圖像中定位文字的方法和濾波器在審
| 申請號: | 201610596200.7 | 申請日: | 2016-07-26 |
| 公開(公告)號: | CN107657254A | 公開(公告)日: | 2018-02-02 |
| 發明(設計)人: | 朱二龍;羅旻 | 申請(專利權)人: | 北京新岸線網絡技術有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 定位 文字 方法 濾波器 | ||
技術領域
本發明涉及濾波器技術,尤其涉及對圖像中的文字進行處理的技術。
背景技術
隨著互聯網視頻內容的不斷增加,以及數字圖書館、視頻點播、遠程教學等大量的多媒體應用,如何在海量視頻中檢索出所需要的資料顯得至關重要。傳統的基于關鍵詞描述的視頻檢索因為描述能力有限、主觀性強、手工標注等原因,已經不能滿足海量視頻檢索的需求。因此從20實際90年代開始,基于內容的視頻檢索技術成為研究的熱點問題,而視頻字幕的識別技術正是實現視頻檢索的關鍵技術。目前提出的視頻字幕檢測方法,根據所使用的特征,大體可以分為基于區域、基于邊緣、基于紋理三種。很多算法實際上綜合利用了以上的某兩種或全部三種特征。
目前,提出了一種基于筆畫的字幕檢測方案。基于筆畫進行字幕檢測的技術方案,需要設計一種筆畫濾波器,這種濾波器和傳統的邊緣紋理濾波器不同,它可以檢測到圖像中不同尺度的形條結構,對不具有條形結構的邊緣和紋理不敏感,這樣就會對一些非文字的背景干擾有更好的魯棒性。
基于筆畫檢測進行字幕檢測的技術方案很有意義,但目前設計的筆畫濾波器的應用非常簡單,并沒有充分考慮到筆畫線條亮度一致性、筆畫角點和交叉點的影響,降低了筆畫檢測的效果。
發明內容
有鑒于此,本發明的一個目的是提供一種在圖像中定位文字的方法和濾波器。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。其唯一目的是用簡單的形式呈現一些概念,以此作為后面的詳細說明的序言。
本發明公開了一種在圖像中定位文字的方法,包括:
接收待檢測圖像;
計算所述圖像的亮筆畫圖和暗筆畫圖;
利用所述亮筆畫圖和暗筆畫圖,計算文字分布區域;
將每個文字分布區域分割成至少一個文字行;
確定每個文字行的上下邊界。
較佳地,所述計算文字分布區域包括:
利用所述亮筆畫圖和暗筆畫圖,計算筆畫密度圖;
對所述亮筆畫圖做二值化處理;
將二值化處理后的亮筆畫圖和所述筆畫密度圖進行或運算;
以新的筆畫密度圖中的白色像素點連接成的區域作為文字分布區域。
較佳地,所述分割文字行包括:
在每個文字分布區域對像素在亮筆畫圖上的亮度值進行水平方向上的投影,獲得每個文字分布區域的亮度直方圖;
在每個文字分布區域將每一行像素在亮筆畫圖上從零變到非零的次數進行累加,獲得每個文字分布區域的交點直方圖;
計算亮度直方圖上的值小于第一閾值,且在交點直方圖上的值小于第二閾值的像素點作為分割點;
在每個文字分布區域沿著查找到的分割點將文字分布區域水平分割開,形成多個文字行。
較佳地,所述確定每個文字行的上下邊界包括:
對于每個文字行,從所述亮度直方圖的最大值分別向上下兩個方向查找該文字行的邊界點,沿著邊界點水平分割開,形成文字行的上下邊界;
其中,邊界點滿足下述條件:
該點在亮度直方圖上的值小于第三閾值,或在交點直方圖上的值小于第四閾值。
較佳地,還包括從每一文字行中依次識別并提取獨立的文字。
本發明還公開了一種濾波器,用于對圖像中的文字筆畫進行濾波處理,包括:
輸入端口,用于接收待檢測圖像;
圖像處理單元,用于計算所述圖像的亮筆畫圖和暗筆畫圖;
位置運算單元,用于利用所述亮筆畫圖和暗筆畫圖,計算文字分布區域;
分割單元,用于將每個文字分布區域分割成至少一個文字行;
邊界確定單元,用于確定每個文字行的上下邊界。
較佳地,所述位置運算單元包括:
第一單元,利用所述亮筆畫圖和暗筆畫圖,計算筆畫密度圖;
第二單元,對所述亮筆畫圖做二值化處理;
第三單元,將二值化處理后的亮筆畫圖和所述筆畫密度圖進行或運算;
第四單元,以新的筆畫密度圖中的白色像素點連接成的區域作為文字分布區域。
較佳地,所述分割單元包括:
第一單元,在每個文字分布區域對像素在亮筆畫圖上的亮度值進行水平方向上的投影,獲得每個文字分布區域的亮度直方圖;
第二單元,在每個文字分布區域將每一行像素在亮筆畫圖上從零變到非零的次數進行累加,獲得每個文字分布區域的交點直方圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京新岸線網絡技術有限公司,未經北京新岸線網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610596200.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種新型自動化粉末滲鋅裝置
- 下一篇:低溫低損傷膜層沉積系統
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





