[發明專利]文字區域檢測方法及裝置有效
| 申請號: | 201210317019.X | 申請日: | 2012-08-30 |
| 公開(公告)號: | CN103679168B | 公開(公告)日: | 2018-11-09 |
| 發明(設計)人: | 丁二銳 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06K9/46 | 分類號: | G06K9/46;G06K9/20 |
| 代理公司: | 北京鴻德海業知識產權代理事務所(普通合伙) 11412 | 代理人: | 袁媛 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 區域 檢測 方法 裝置 | ||
本發明公開了一種文字區域檢測方法及裝置,一種文字區域檢測方法包括:對目標圖像進行角點檢測,得到該圖像的角點高置信度區域;對目標圖像進行邊緣檢測,得到該圖像的邊緣連通區域;對于檢測到的任意角點高置信度區域,判斷該區域是否滿足預設的規則形狀條件;如果是,則將該區域確定為文字區域;如果否,則進一步判斷該區域與邊緣連通區域的重合比例是否達到預設的閾值,如果是,則將該區域確定為文字區域。本發明技術方案,采用角點檢測與邊緣檢測結合的方式,確認圖像上的文字區域,在文字背景復雜、文字區域不規則的情況下,能夠更有效地檢測出文字區域。
技術領域
本發明涉及圖像處理技術領域,特別是涉及文字區域檢測方法及裝置。
背景技術
多媒體技術的發展,使得在計算機上表達信息的形式更為豐富,很大程度上改變了計算機的應用領域。其中,圖像(Images)是一種應用比較廣泛的媒體,特別是隨著圖像處理技術的發展,使得圖像已經成為計算機以及互聯網領域的一種重要的信息承載形式。
與文字相比,圖像有著更強的表現能力,但是相對地,對于計算機而言,理解一幅圖像的工作也變得更為復雜。但是,如果圖像中含有文字內容,那么這些文字往往可以為圖像語義的理解提供非常豐富的信息,因此正確地從圖像中提取文字,可以成為理解圖像語義的一條捷徑。文字信息提取的前提是準確檢測到圖像中的文字區域。目前,常用的檢測方法是通過對圖片直接進行二值化或邊緣提取,然后對連通域進行啟發式規則分析進而得到文字區域;或者在正負樣本集上,通過機器學習如支持向量機等分類器進行訓練,對圖片中可能存在的文字區域進行徹查判斷。
然而在實際應用中,很多圖像的噪聲較大,例如一些非專業用戶拍攝的照片,經常受光照影響嚴重而且容易出現模糊,還有一些Web圖像,盡管圖像本身質量較好,但是文字背景非常復雜,文字區域也經常不規則,導致基于連通域分析的檢測方法受到嚴重干擾,提取到的連通域往往會出現斷裂或者背景粘連的情況,嚴重影響文字檢測的準確度;通過機器學習方法的文字檢測又往往受到訓練樣本的限制,不能擴展到樣本之外的情況,而且對于漢字這樣大字庫的文字類型,無論是從檢測速度還是實現成本考慮,目前都是難以實際應用的。
發明內容
為解決上述技術問題,本發明實施例提供一種文字區域檢測方法及裝置,以解決/以實現,技術方案如下:
本發明實施例提供一種文字區域檢測方法,該方法包括:
對目標圖像進行角點檢測,得到該圖像的角點高置信度區域;
對目標圖像進行邊緣檢測,得到該圖像的邊緣連通區域;
對于檢測到的任意角點高置信度區域,判斷該區域是否滿足預設的規則形狀條件;
如果是,則將該區域確定為文字區域;
如果否,則進一步判斷該區域與邊緣連通區域的重合比例是否達到預設的閾值,如果是,則將該區域確定為文字區域。
根據本發明的一種具體實施方式,在對目標圖像進行角點檢測之前,還包括:
對所述目標圖像進行下采樣處理。
根據本發明的一種具體實施方式,所述對目標圖像進行角點檢測,得到該圖像中的角點高置信度區域,包括:
對目標圖像進行尺度變換后進行角點檢測,得到該圖像在多尺度下的角點高置信度區域。
根據本發明的一種具體實施方式,
根據當前尺度下,
已確定的文字區域與角點高置信度區域的重合度,和/或
已確定的文字區域與邊緣連通區域的重合度,
判斷是否要進行其他尺度下的角點檢測。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210317019.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種集成電路及其形成方法
- 下一篇:焊接用裝置、電弧焊接系統以及電弧焊接方法





