[發(fā)明專利]基于圖像識別技術(shù)的彩色圖像文字段落分割與識別方法有效
| 申請?zhí)枺?/td> | 201610593389.4 | 申請日: | 2016-07-26 |
| 公開(公告)號: | CN106228157B | 公開(公告)日: | 2018-03-27 |
| 發(fā)明(設(shè)計)人: | 車少帥;于志文;邵一婷;胡笳 | 申請(專利權(quán))人: | 江蘇鴻信系統(tǒng)集成有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46 |
| 代理公司: | 南京鐘山專利代理有限公司32252 | 代理人: | 戴朝榮 |
| 地址: | 210005 *** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 圖像 識別 技術(shù) 彩色 文字 段落 分割 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于圖像處理領(lǐng)域,尤其涉及一種基于圖像識別技術(shù)的彩色圖像文字段落分割與識別方法。
背景技術(shù)
從人們最開始提出相應(yīng)的概念到現(xiàn)在,OCR(Optical Character Recognition,光學(xué)字符識別)技術(shù)經(jīng)歷了近一個世紀的發(fā)展,現(xiàn)在,對于背景簡單的文本,可高效準確的將其轉(zhuǎn)化成可為計算機讀懂的電子文本。隨著技術(shù)發(fā)展的越來越成熟,應(yīng)用面越來越廣,市場需求越來越大,各種文字識別的軟件和工具相繼推出。然而,經(jīng)典的文字識別技術(shù)只針對通過掃描得到的背景簡單、分辨率和對比度高的圖像有理想的識別率。但是,現(xiàn)實生活中有很多帶有文字的場景,比如票據(jù)圖像、證件圖像、飯店菜單圖像、產(chǎn)品傳單圖像、路牌、車站牌、店名、商品簡介等,想要獲得這些處于自然場景中的文字,依靠掃描的方式顯然并不太實際,而且大量圖片數(shù)據(jù)的存儲占用很大的存儲空間,圖像內(nèi)的寶貴數(shù)據(jù)因為圖像的丟失而丟失等缺陷需要人們使用文字提取技術(shù)來解決這一問題。目前,雖然有很多針對自然場景中文本識別的研究,但其結(jié)果并不如人們期望中的理想。 一般通過拍攝設(shè)備獲得的圖片分為帶有自然場景的圖片和純文字圖片。由于自然場景的復(fù)雜性,造成了處于其中的文字背景相當復(fù)雜,還由于拍攝地點、拍攝角度和光線強弱等各種原因造成的文字的字體、大小、對比度以及亮度等不均勻,增大了定位文本區(qū)域的難度,直接影響了文字區(qū)域定位的準確性和字符識別的結(jié)果的準確性;因此研究日常生活中所遇到的復(fù)雜背景下彩色圖像中文字的準確的提取與準確的識別,有著重要的意義。
然而,在文字識別領(lǐng)域如何準確快速提取到彩色圖像中的文字字段還有待進一步研究開發(fā),現(xiàn)有技術(shù)中還有部分涉及這方面的技術(shù)領(lǐng)域,但是都存在一定不足,例如,對于有些字體的提取技術(shù),雖然能獲取到圖像中文字字段,但并不準確;在字體組合技術(shù)方面,現(xiàn)有技術(shù)大多只考慮位置關(guān)系而忽略了字體其他信息,如顏色等,只考慮文字的位置從而無法排除背景顏色對文字的干擾作用,準確性還會降低。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是針對上述現(xiàn)有技術(shù)的不足提供一種基于圖像識別技術(shù)的彩色圖像文字段落分割與識別方法,本發(fā)明基于圖像識別技術(shù)的彩色圖像文字段落分割與識別方法能快速識別圖像中主要的文字輪廓,通過字體輪廓的位置和顏色從而準確的提取彩色圖像中的文字數(shù)據(jù),將提取的文字數(shù)據(jù)保存起來,解決了海量圖片數(shù)據(jù)存儲的壓力的問題,以及解決了因為圖像的丟失而丟失圖像內(nèi)的寶貴文字數(shù)據(jù)的問題。
為實現(xiàn)上述技術(shù)目的,本發(fā)明采取的技術(shù)方案為:
基于圖像識別技術(shù)的彩色圖像文字段落分割與識別方法,包括:
對原圖像進行清晰度分析處理,提取圖像的全部輪廓和全部輪廓所在的位置;
從圖像的全部輪廓中計算并提取符合字體輪廓的外接矩形,將每個字體輪廓的外接矩形,保存到矩形集合VECTOR中;
通過原圖像的顏色通道提取每個字體輪廓的相應(yīng)通道分量,分析并提取每個字體輪廓的顏色;
矩形集合VECTOR中的外接矩形根據(jù)字體輪廓的位置和字體輪廓的顏色在水平方向和垂直方向進行組合生長,得到已經(jīng)段落分割的字體輪廓;
通過OCR識別引擎,將已經(jīng)段落分割的字體輪廓生成文字字符。
作為本發(fā)明進一步改進的技術(shù)方案,所述對原圖像進行清晰度分析處理,包括:
對原圖像進行清晰度檢測并計算原圖像的清晰度,設(shè)定清晰度過高閾值與清晰度過低閾值;
將原圖像的清晰度分別與清晰度過高閾值和清晰度過低閾值進行比較從而實現(xiàn)對原圖像進行中值濾波或增強處理;
通過圖像的亮度水平,確定圖像二值化的閾值,對圖像進行自適應(yīng)二值化。
作為本發(fā)明進一步改進的技術(shù)方案,所述從圖像的全部輪廓中計算并提取符合字體輪廓的外接矩形,包括:
計算經(jīng)過清晰度分析處理的圖像的全部輪廓的外接矩形,設(shè)定外接矩形的長最大閾值和外接矩形的長最小閾值,設(shè)定外接矩形的寬最大閾值和外接矩形的寬最小閾值;
從圖像的全部輪廓的外接矩形中提取符合外接矩形的長的范圍在外接矩形的長最大閾值和外接矩形的長最小閾值之間且外接矩形的寬的范圍在外接矩形的寬最大閾值和外接矩形的寬最小閾值之間的字體輪廓的外接矩形。
作為本發(fā)明進一步改進的技術(shù)方案,所述通過原圖像的顏色通道提取每個字體輪廓的相應(yīng)通道分量,包括:
從原圖像的HSV顏色通道與RGB顏色通道來提取每個字體輪廓的相應(yīng)通道分量,根據(jù)HSV顏色通道的分量和RGB顏色通道的分量分析每個字體輪廓的相應(yīng)通道分量從而提取每個字體輪廓的顏色。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于江蘇鴻信系統(tǒng)集成有限公司,未經(jīng)江蘇鴻信系統(tǒng)集成有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610593389.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種確定信息提示內(nèi)容的方法與裝置
- 下一篇:圖片檢測的方法和裝置
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





