[發明專利]一種基于自啟發式策略的自然場景文字檢測方法及系統有效
| 申請號: | 201710203601.6 | 申請日: | 2017-03-30 |
| 公開(公告)號: | CN106934386B | 公開(公告)日: | 2019-06-25 |
| 發明(設計)人: | 王潤民;錢盛友;楊劍鋒;鄒孝 | 申請(專利權)人: | 湖南師范大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/32;G06K9/34;G06K9/62;G06K9/72 |
| 代理公司: | 長沙市融智專利事務所(普通合伙) 43114 | 代理人: | 龔燕妮 |
| 地址: | 410081 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 啟發式 策略 自然 場景 文字 檢測 方法 系統 | ||
本發明公開了一種基于自啟發式策略的自然場景文字檢測方法及系統,建立兩層級聯濾波機制以判斷文字區域與背景區域,考慮到文字區域在灰度自然場景圖像中存在暗底淺字或者淺底暗字兩種模式,對文字區域對比度類型進行判斷以將灰度自然場景圖像中的文字區域的對比度統一為暗底淺字模式;將兩層級聯濾波處理后判斷為文字的結果視為種子文字,針對每一個種子文字構建自啟發式搜索策略在其鄰近區域,采用訓練好的深度神經網絡以滑動檢測窗口的方式檢測漏檢文字以提高文字檢測召回率,最后將相鄰文字以單詞為單元分割開來。本發明所公開的自然場景文字檢測方法及系統對實現自然場景文字語義自動化理解具有很高的實用價值。
技術領域
本發明屬于圖像識別領域,特別涉及一種基于自啟發式策略的自然場景文字檢測方法及系統。
背景技術
文字作為一種極其重要的信息載體在人類文明進程中發揮著極大的促進作用,作為人類語言的可視化載體,文字廣泛存在于人類社會的各個方面。近年來,隨著計算機視覺技術的快速發展,人類設法使得計算機能夠模擬人類的視覺理解機制,對所捕獲的圖像進行分析并自主理解圖像內容、從而獲取圖像中的重要線索;自然場景中包括了各種場景內容,文字作為一種重要的場景內容具有抽象的描述能力與高度的概括能力。對圖像中的文字進行檢測與識別將有助于理解圖像內容,并獲取重要的信息線索。近年來,自然場景文字檢測已成為了計算機視覺與模式識別領域中的一個重要研究內容。該技術旨在從所捕獲的自然場景圖像中自動檢測文字區域,從而為后續文字識別與語義理解提供技術支持。該技術在自然場景圖像理解、視障人輔助閱讀、機器人自主導航、海量視頻檢索、以及便攜式設備文字檢測與翻譯等方面有著廣泛的應用前景。
自然場景文字檢測是實現后續文字識別與語義理解的第一步,是整個文字識別系統中的重要組成部分,該技術性能的好壞將直接影響到整個系統識別率的高低。盡管傳統的光學字符識別技術(Optical Character Recognition,OCR)已日趨成熟,然而該技術對自然場景文字檢測與識別的性能卻遠未達到實用水平。自然場景圖像中的復雜背景、文字字體種類、字體大小、字體排列方向、字體顏色、光照條件以及拍攝角度等因素影響直接導致了難以魯棒地檢測自然場景文字。
基于自然場景文字檢測技術的廣泛應用前景以及其重要的理論研究價值,該技術引起了國內外學者的廣泛關注,文檔分析與識別國際會議(International Conference onDocument Analysis and Recognition,ICDAR)定期舉行自然場景文字檢測競賽,評估現有技術水平并分析其優劣性。目前,自然場景文字檢測方法主要沿用三條技術路線:基于連通組件分析的自然場景文字檢測方法、基于紋理特征的自然場景文字檢測方法、以及基于連通組件與紋理特征的自然場景文字檢測方法。
基于連通組件分析的自然場景文字檢測方法,其核心內容是設計快速、有效的連通組件分析器。該方法能快速地實施文字檢測,但在處理背景復雜、噪聲干擾、光照變化以及顏色多變等情況時缺乏魯棒性?;诩y理特征的自然場景文字檢測方法通常以滑動檢測窗口的方式多尺度遍歷圖像,從而影響了文字檢測效率,但該方法能較好地應對復雜背景中的自然場景文字檢測問題;基于連通組件與紋理特征的自然場景文字檢測方法,該方法通常首先對連通組件進行分析以獲得文字候選區域,然后利用文字候選區域的紋理特征采用訓練好的分類器進行判別處理,該方法相對于單純地采用連通組件分析的自然場景文字檢測方法更能有效地解決復雜自然場景中的文字檢測問題,相對于單純地采用紋理特征的自然場景文字檢測方法在檢測效率上有所提高。如前述分析可知,諸多方面因素的影響導致了該技術距實用水平有較大的差距。考慮到自然場景文字檢測問題的特殊性與復雜性,如何快速、準確地在復雜自然場景中檢測文字是噩待解決的技術難題。
發明內容
本發明提供了一種基于自啟發式策略的自然場景文字檢測方法及系統,其目的在于,克服現有技術中自然場景中文字檢測的檢測率不高以及復雜度較高的問題。
一種基于自啟發式策略的自然場景文字檢測方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南師范大學,未經湖南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710203601.6/2.html,轉載請聲明來源鉆瓜專利網。





