[發明專利]一種圖像檢測方法和裝置在審
| 申請號: | 201710076259.8 | 申請日: | 2017-02-13 |
| 公開(公告)號: | CN106846339A | 公開(公告)日: | 2017-06-13 |
| 發明(設計)人: | 李紅匣 | 申請(專利權)人: | 廣州視源電子科技股份有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T7/187 |
| 代理公司: | 北京品源專利代理有限公司11332 | 代理人: | 孟金喆,胡彬 |
| 地址: | 510530 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 檢測 方法 裝置 | ||
技術領域
本發明涉及圖像處理技術領域,尤其涉及一種圖像檢測方法和裝置。
背景技術
隨著數碼攝像設備的成熟和普及,人們已經能夠非常方便快捷地記錄現實世界在不同視角下的方方面面。而作為人類語言的可視化文本,在人類活動中具有特殊而不可替代的地位。自然場景文字檢測是計算機視覺與模式識別技術在目標檢測與識別領域中的重要研究課題之一。該技術目的在于在所拍攝的自然場景圖像中準確地檢測出文字信息,其在自然場景理解與分析、機器人輔助導航、視頻檢索、盲人輔助閱讀及文字翻譯等方面有廣泛的應用前景。
目前,自然場景文本檢測方法分為兩種:基于滑動窗口的方法和基于連通區域的方法。
基于滑動窗口的方法,是指將多尺度的窗口在圖像中從左到右、從上到下進行滑動,并對滑動窗口內的圖像進行分類,判斷其是否為文字區域,為了能夠檢測所有的文本區域,該方法通常需要大量的滑動窗口,導致計算復雜度增高,并不能達到實時的要求。
基于連通區域的方法,是指根據文本固有的屬性,如顏色、紋理、筆劃寬度等,對像素進行相似性聚類,生成大量的連通區域,并對連通區域進行特征(如文字高度、寬度和間距等)提取,過濾非文本區域,從而完成文本檢測,相對于基于滑動窗口的方法,該方法的計算量相對減少,但是對要求連通區域的提取有很高的要求,即所提取的連通區域要包括所有的文字區域,并且很難有效地應對復雜背景的情況。
發明內容
為解決相關技術問題,本發明提供一種圖像檢測方法和裝置,可實現快速、準確地在復雜自然場景中提檢測出文字區域。
為實現上述目的,本發明實施例采用如下技術方案:
第一方面,本發明實施例提供了一種圖像檢測方法,包括:
獲取待檢測圖像;
從所述待檢測圖像中提取最大穩定極值MSER區域,其中,所述MSER區域為連通區域;
過濾所述MSER區域,得到所述待檢測圖像中的文本區域。
第二方面,本發明實施例還對應地提供了一種圖像檢測裝置,包括:
待檢測圖像獲取模塊,用于獲取待檢測圖像;
MSER區域提取模塊,用于從所述待檢測圖像中提取最大穩定極值MSER區域,其中,所述MSER區域為連通區域;
MSER區域過濾模塊,用于過濾所述MSER區域,得到所述待檢測圖像中的文本區域。
本發明實施例提供的技術方案帶來的有益效果:
本技術方案中,獲取待檢測圖像,從待檢測圖像中提取最大穩定極值MSER區域,其中,最大穩定極值區域為連通區域,過濾MSER區域,得到待檢測圖像中的文本區域。通過從待檢測圖像中提取MSER區域,以劃分連通區域的方式提取MSER區域作為候選區域,再對提取到的MSER區域進行過濾篩選,最終得到待檢測圖像中的文本區域,區域劃分有利于減少計算量、提高檢測效率,同時提取MSER區域可減少圖像背景的干擾,可提高在檢測背景復雜的待檢測圖像時的準確率。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對本發明實施例描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據本發明實施例的內容和這些附圖獲得其他的附圖。
圖1是本發明實施例一提供的一種圖像檢測方法的流程示意圖;
圖2A是本發明實施例二提供的一種圖像檢測方法的流程示意圖;
圖2B是圖2A中S250的可選實施方式的流程示意圖;
圖2C是本發明實施例二中使用的卷積神經網絡模型的結構示意圖;
圖3是本發明實施例三提供的一種圖像檢測裝置的架構示意圖;
圖4A是本發明實施例四提供的一種圖像檢測裝置的架構示意圖;
圖4B是圖4A中MSER區域過濾模塊450的可選實施方式的架構示意圖。
具體實施方式
為使本發明解決的技術問題、采用的技術方案和達到的技術效果更加清楚,下面將結合附圖對本發明實施例的技術方案作進一步的詳細描述,顯然,所描述的實施例僅僅是本發明一部分實施例,而不是全部的實施例?;诒景l明中的實施例,本領域技術人員在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
實施例一
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州視源電子科技股份有限公司,未經廣州視源電子科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710076259.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種用于電飯煲內膽中層瀝水的瀝干裝置
- 下一篇:帶有轉料裝置的烘干固化設備
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





