[發(fā)明專(zhuān)利]文本圖像提取裝置以及方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310136363.3 | 申請(qǐng)日: | 2013-04-18 |
| 公開(kāi)(公告)號(hào): | CN104112135B | 公開(kāi)(公告)日: | 2017-06-06 |
| 發(fā)明(設(shè)計(jì))人: | 汪留安;孫俊;何源;范偉;勝山裕;堀田悅伸 | 申請(qǐng)(專(zhuān)利權(quán))人: | 富士通株式會(huì)社 |
| 主分類(lèi)號(hào): | G06K9/46 | 分類(lèi)號(hào): | G06K9/46 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司11227 | 代理人: | 王萍,陳煒 |
| 地址: | 日本神*** | 國(guó)省代碼: | 暫無(wú)信息 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文本 圖像 提取 裝置 以及 方法 | ||
技術(shù)領(lǐng)域
本公開(kāi)涉及圖像處理領(lǐng)域,更具體地涉及一種文本圖像的提取裝置和方法。
背景技術(shù)
隨著計(jì)算機(jī)、多媒體以及通信技術(shù)的飛速發(fā)展,文字信息正越來(lái)越多地以圖像形式出現(xiàn)。通常,圖像中的文本信息是圖像內(nèi)容的重要來(lái)源,因此對(duì)圖像中文本的檢測(cè)、分割和識(shí)別對(duì)于圖像語(yǔ)義的理解、索引和檢索是非常有價(jià)值的。目前通常采用的一種文本檢測(cè)方法是基于邊緣的檢測(cè)方法,但是這種方法由于背景復(fù)雜且沒(méi)有先驗(yàn)知識(shí),因此不能精確地分割出可靠的文本區(qū)域。基于紋理的方法是目前通常采用的另一種文本檢測(cè)方法,但是該方法對(duì)于文本排列的方向非常敏感并且計(jì)算量也非常大。
因此,當(dāng)前亟需一種能夠快速、可靠的文本圖像提取裝置以及方法。
發(fā)明內(nèi)容
在下文中給出了關(guān)于本公開(kāi)的簡(jiǎn)要概述,以便提供關(guān)于本公開(kāi)的某些方面的基本理解。應(yīng)當(dāng)理解,這個(gè)概述并不是關(guān)于本公開(kāi)的窮舉性概述。它并不意圖確定本公開(kāi)的關(guān)鍵或重要部分,也不意圖限定本公開(kāi)的范圍。其目的僅僅是以簡(jiǎn)化的形式給出某些概念,以此作為稍后論述的更詳細(xì)描述的前序。
鑒于現(xiàn)有技術(shù)的上述缺陷,本公開(kāi)的目的之一是提供一種文本圖像的提取裝置和方法,以至少克服現(xiàn)有技術(shù)中的上述問(wèn)題。
根據(jù)本公開(kāi)的一個(gè)方面,提供了一種文本圖像提取裝置,用于基于用戶(hù)指定區(qū)域從輸入圖像中提取文本圖像區(qū)域,該文本圖像提取裝置包括:邊緣極性確定單元,用于根據(jù)在輸入圖像中檢測(cè)到的每個(gè)邊緣的亮度變化趨勢(shì)確定每個(gè)邊緣的極性;筆劃寬度確定單元,用于將極性相反的兩個(gè)邊緣確定為匹配邊緣對(duì),并且基于該用戶(hù)指定區(qū)域中的各個(gè)匹配邊緣對(duì)中的兩個(gè)匹配邊緣之間的距離確定該用戶(hù)指定區(qū)域中的文本的筆劃寬度;前景像素確定單元,用于將輸入圖像的匹配邊緣對(duì)中的、兩個(gè)匹配邊緣之間的距離與筆劃寬度之差在第一預(yù)定范圍之內(nèi)的匹配邊緣對(duì)之間的像素確定為輸入圖像的前景像素,并且將其余像素確定為輸入圖像的背景像素;以及文本圖像區(qū)域獲取單元,利用前景像素對(duì)用戶(hù)指定區(qū)域進(jìn)行擴(kuò)展,從而在輸入圖像中獲取包括與用戶(hù)指定區(qū)域相關(guān)的文本圖像的文本圖像區(qū)域。
根據(jù)本公開(kāi)的又一個(gè)方面,還提供一種文本圖像提取方法,用于基于用戶(hù)指定區(qū)域從輸入圖像中獲取文本圖像區(qū)域,該文本圖像提取方法包括:根據(jù)在輸入圖像中檢測(cè)到的每個(gè)邊緣的亮度變化趨勢(shì)確定每個(gè)邊緣的極性;將極性相反的兩個(gè)邊緣確定為匹配邊緣對(duì),并且基于該用戶(hù)指定區(qū)域中的各個(gè)匹配邊緣對(duì)中的兩個(gè)匹配邊緣之間的距離確定該用戶(hù)指定區(qū)域中的文本的筆劃寬度;將輸入圖像的匹配邊緣對(duì)中兩個(gè)匹配邊緣之間的距離與筆劃寬度之差在第一預(yù)定范圍之內(nèi)的匹配邊緣對(duì)之間的像素確定為輸入圖像的前景像素,并且將其余像素確定為輸入圖像的背景像素;以及利用前景像素對(duì)用戶(hù)指定區(qū)域進(jìn)行擴(kuò)展,從而在輸入圖像中獲取包括與用戶(hù)指定區(qū)域相關(guān)的文本圖像的文本圖像區(qū)域。
根據(jù)本公開(kāi)的另一個(gè)方面,還提供了一種電子設(shè)備,該電子設(shè)備包括如上所述的文本圖像提取裝置。
依據(jù)本公開(kāi)的其它方面,還提供了一種使得計(jì)算機(jī)用作如上所述的文本圖像提取裝置的程序。
依據(jù)本公開(kāi)的又一方面,還提供了相應(yīng)的計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),該計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有能夠由計(jì)算設(shè)備執(zhí)行的計(jì)算機(jī)程序,該計(jì)算機(jī)程序在執(zhí)行時(shí)能夠使計(jì)算設(shè)備執(zhí)行上述文本圖像提取方法。
上述根據(jù)本公開(kāi)實(shí)施例的文本圖像提取裝置和方法,至少能夠獲得以下益處之一:能夠以簡(jiǎn)單、快速的方式實(shí)現(xiàn)對(duì)文本圖像區(qū)域的提取,并且能夠大大提高了文本檢測(cè)的精度。
通過(guò)以下結(jié)合附圖對(duì)本公開(kāi)的最佳實(shí)施例的詳細(xì)說(shuō)明,本公開(kāi)的這些以及其他優(yōu)點(diǎn)將更加明顯。
附圖說(shuō)明
本公開(kāi)可以通過(guò)參考下文中結(jié)合附圖所給出的描述而得到更好的理解,其中在所有附圖中使用了相同或相似的附圖標(biāo)記來(lái)表示相同或者相似的部件。所述附圖連同下面的詳細(xì)說(shuō)明一起包含在本說(shuō)明書(shū)中并且形成本說(shuō)明書(shū)的一部分,而且用來(lái)進(jìn)一步舉例說(shuō)明本公開(kāi)的優(yōu)選實(shí)施例和解釋本公開(kāi)的原理和優(yōu)點(diǎn)。其中:
圖1是示意性地示出根據(jù)本公開(kāi)實(shí)施例的文本圖像提取裝置的一種示例結(jié)構(gòu)的框圖。
圖2示意性地示出文本圖像的一種示例。
圖3是示意性地示出如圖1所示的文本圖像區(qū)域獲取單元的一種可能的示例結(jié)構(gòu)的框圖。
圖4是根據(jù)本公開(kāi)實(shí)施例的文本圖像區(qū)域提取裝置的另一示例性結(jié)構(gòu)的框圖。
圖5是示出根據(jù)本公開(kāi)實(shí)施例的文本圖像區(qū)域提取裝置的又一示例性結(jié)構(gòu)的框圖。
圖6是示出根據(jù)本公開(kāi)另一實(shí)施例的文本圖像區(qū)域提取裝置的示例性結(jié)構(gòu)圖。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于富士通株式會(huì)社,未經(jīng)富士通株式會(huì)社許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310136363.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





