[發(fā)明專利]一種基于圖割的復(fù)雜背景文本圖像分割方法有效
| 申請?zhí)枺?/td> | 201110322549.9 | 申請日: | 2011-10-21 |
| 公開(公告)號: | CN102332097A | 公開(公告)日: | 2012-01-25 |
| 發(fā)明(設(shè)計)人: | 王春恒;史存召;肖柏華;周文 | 申請(專利權(quán))人: | 中國科學(xué)院自動化研究所 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 周國城 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 復(fù)雜 背景 文本 圖像 分割 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及模式識別與機器視覺領(lǐng)域中的文本圖像分割技術(shù)領(lǐng)域,具體地是一種基于圖割的復(fù)雜背景文本圖像分割方法。
背景技術(shù)
隨著數(shù)碼相機、攝像頭、超高速掃描儀等圖像獲取設(shè)備的廣泛應(yīng)用,圖像中的信息越來越引起人們的關(guān)注,然而計算機理解圖像的內(nèi)容,目前還很困難。圖像中嵌入的文字能夠提供一些人們所要的重要信息,對理解圖像中的內(nèi)容有著重要的幫助。讓計算機像人類一樣識別圖像中的文字,即文字的自動檢測識別系統(tǒng),近年來越來越引起了人們的關(guān)注,它對于圖像和視頻的存儲、分類、理解及檢索等來說具有極其重要的意義,有著廣泛的應(yīng)用前景和商業(yè)價值。在許多情況下,圖像中的場景文字甚至成為圖像最主要、最關(guān)鍵的信息,因此很多研究者致力于研究圖像中文本塊的檢測方法研究,然而由于圖像中的文本塊往往具有非常復(fù)雜的背景,比如光照、文字大小,分辨率等,將檢測到的文本塊直接送入傳統(tǒng)的OCR識別引擎,其識別效果非常差,因此,文本塊的分割技術(shù),是連接文本檢測與識別的重要技術(shù),對于整個系統(tǒng)的良好性能不可或缺。
現(xiàn)在的大部分文本塊分割方法可以大致歸為兩類:統(tǒng)計閾值方法及機器學(xué)習(xí)方法。其中統(tǒng)計閾值方法根據(jù)圖像的灰度或者顏色的統(tǒng)計特性計算出全局閾值或者局部閾值來對文本圖像就行分割,此類方法對于傳統(tǒng)的掃描文檔或者是背景較為簡單的文本塊分割效果可以,然而當(dāng)文字和背景具有相近的亮度時,將無法很好得分割。機器學(xué)習(xí)的方法包括無監(jiān)督的顏色聚類,各種模型學(xué)習(xí)方法。當(dāng)文字及背景具有相近的顏色時,顏色聚類的方法將失效;如果能夠?qū)W習(xí)出合適的模型,模型選擇方法可以得到滿意的效果,然而學(xué)習(xí)出一種可以分割任何復(fù)雜背景的文本塊的模型很難實現(xiàn)。
統(tǒng)計閾值方法沒有充分利用文字筆畫的結(jié)構(gòu)特性,而學(xué)習(xí)合適模型所需要的大量訓(xùn)練樣本又很難獲取。其實文字也是一種特殊的目標(biāo),因此可以采用各種各樣的目標(biāo)分割方法。其中交互式目標(biāo)分割越來越受到人們歡迎,在此方面圖割技術(shù)得到廣泛應(yīng)用。傳統(tǒng)的交互式目標(biāo)分割需要用戶給出一些標(biāo)簽,然而考慮文字的固有特性,可以為圖割自動給出一些標(biāo)簽,從而實現(xiàn)用圖割對文字進行分割。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種基于圖割的復(fù)雜背景文本圖像分割方法,采用分-合技術(shù),本方法具有局部空間自適應(yīng)性,因此可以處理背景不均勻的復(fù)雜背景文本圖像;同時,根據(jù)文字筆畫的固有特征,自動為圖割給出一些標(biāo)簽作為硬約束,結(jié)合軟約束將這些硬約束擴散到整個子圖進而分割子圖。分割后的子圖經(jīng)合并形成整體的文本分割圖像。
為達到上述目的,本發(fā)明的技術(shù)解決方案如下:
一種基于圖割的復(fù)雜背景文本圖像分割方法,其特征在于,包括以下步驟:
步驟1,將原始文本塊圖像粗分為若干個子圖;
步驟2,通過判斷每個子圖的極性,確定整個文本塊圖像的極性;
步驟3,根據(jù)文本塊圖像的極性,結(jié)合字符筆畫的固有特征,自動為圖割提供一些置信度較高的前景點和背景點作為圖割的硬約束;
步驟4,根據(jù)獲得的硬約束,對子圖施加相應(yīng)的軟約束,用圖割將硬約束傳播到整個子圖,進而得到子圖的最優(yōu)分割;
步驟5,將得到的最優(yōu)分割的子圖合并得到整體的文本分割圖像。
本發(fā)明采用分-合技術(shù),首先將文本圖像粗略劃分為子圖,再對子圖進行操作,因此本方法具有局部空間自適應(yīng)性,可以處理背景不均勻的復(fù)雜背景文本圖像;同時,根據(jù)文字筆畫的固有特征,本方法自動為圖割給出一些標(biāo)簽作為硬約束,結(jié)合軟約束將這些硬約束擴散到整個子圖進而分割子圖。本方法對復(fù)雜背景的文本圖像具有很好的分割效果。
附圖說明
圖1是本發(fā)明提出的一種基于圖割的復(fù)雜背景文本圖像分割方法的流程圖。
圖2是本發(fā)明中將文本圖像劃分為子圖的結(jié)果示意圖。
圖3是本發(fā)明中硬約束獲取準(zhǔn)則及結(jié)果示意圖。
圖4是根據(jù)本發(fā)明實施例的文本圖像分割結(jié)果示意圖。
具體實施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚明白,以下結(jié)合具體實施例,并參照附圖,對本發(fā)明進一步詳細說明。
圖1為本發(fā)明所述方法的實施例流程圖,參照圖1,本發(fā)明提出的一種基于圖割的復(fù)雜背景文本圖像分割方法具體包括以下步驟:
步驟1,將原始文本塊圖像粗分為若干個子圖;
首先,輸入一副原始文本塊圖像,求取原始文本塊圖像的邊緣圖像,然后,對邊緣圖像進行連通域分析,根據(jù)字符連通域的一些特征,找到一些其特性符合字符特性的連通域子圖,作為“種子”子圖,依據(jù)這些“種子”子圖將原始文本塊圖像粗分為若干個子圖。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院自動化研究所,未經(jīng)中國科學(xué)院自動化研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110322549.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:花箱支承框裝置
- 下一篇:一種移動終端組合式電路板及其組裝方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





