[發明專利]基于圖像識別技術的彩色圖像文字段落分割與識別方法有效
| 申請號: | 201610593389.4 | 申請日: | 2016-07-26 |
| 公開(公告)號: | CN106228157B | 公開(公告)日: | 2018-03-27 |
| 發明(設計)人: | 車少帥;于志文;邵一婷;胡笳 | 申請(專利權)人: | 江蘇鴻信系統集成有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/46 |
| 代理公司: | 南京鐘山專利代理有限公司32252 | 代理人: | 戴朝榮 |
| 地址: | 210005 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 圖像 識別 技術 彩色 文字 段落 分割 方法 | ||
技術領域
本發明屬于圖像處理領域,尤其涉及一種基于圖像識別技術的彩色圖像文字段落分割與識別方法。
背景技術
從人們最開始提出相應的概念到現在,OCR(Optical Character Recognition,光學字符識別)技術經歷了近一個世紀的發展,現在,對于背景簡單的文本,可高效準確的將其轉化成可為計算機讀懂的電子文本。隨著技術發展的越來越成熟,應用面越來越廣,市場需求越來越大,各種文字識別的軟件和工具相繼推出。然而,經典的文字識別技術只針對通過掃描得到的背景簡單、分辨率和對比度高的圖像有理想的識別率。但是,現實生活中有很多帶有文字的場景,比如票據圖像、證件圖像、飯店菜單圖像、產品傳單圖像、路牌、車站牌、店名、商品簡介等,想要獲得這些處于自然場景中的文字,依靠掃描的方式顯然并不太實際,而且大量圖片數據的存儲占用很大的存儲空間,圖像內的寶貴數據因為圖像的丟失而丟失等缺陷需要人們使用文字提取技術來解決這一問題。目前,雖然有很多針對自然場景中文本識別的研究,但其結果并不如人們期望中的理想。 一般通過拍攝設備獲得的圖片分為帶有自然場景的圖片和純文字圖片。由于自然場景的復雜性,造成了處于其中的文字背景相當復雜,還由于拍攝地點、拍攝角度和光線強弱等各種原因造成的文字的字體、大小、對比度以及亮度等不均勻,增大了定位文本區域的難度,直接影響了文字區域定位的準確性和字符識別的結果的準確性;因此研究日常生活中所遇到的復雜背景下彩色圖像中文字的準確的提取與準確的識別,有著重要的意義。
然而,在文字識別領域如何準確快速提取到彩色圖像中的文字字段還有待進一步研究開發,現有技術中還有部分涉及這方面的技術領域,但是都存在一定不足,例如,對于有些字體的提取技術,雖然能獲取到圖像中文字字段,但并不準確;在字體組合技術方面,現有技術大多只考慮位置關系而忽略了字體其他信息,如顏色等,只考慮文字的位置從而無法排除背景顏色對文字的干擾作用,準確性還會降低。
發明內容
本發明所要解決的技術問題是針對上述現有技術的不足提供一種基于圖像識別技術的彩色圖像文字段落分割與識別方法,本發明基于圖像識別技術的彩色圖像文字段落分割與識別方法能快速識別圖像中主要的文字輪廓,通過字體輪廓的位置和顏色從而準確的提取彩色圖像中的文字數據,將提取的文字數據保存起來,解決了海量圖片數據存儲的壓力的問題,以及解決了因為圖像的丟失而丟失圖像內的寶貴文字數據的問題。
為實現上述技術目的,本發明采取的技術方案為:
基于圖像識別技術的彩色圖像文字段落分割與識別方法,包括:
對原圖像進行清晰度分析處理,提取圖像的全部輪廓和全部輪廓所在的位置;
從圖像的全部輪廓中計算并提取符合字體輪廓的外接矩形,將每個字體輪廓的外接矩形,保存到矩形集合VECTOR中;
通過原圖像的顏色通道提取每個字體輪廓的相應通道分量,分析并提取每個字體輪廓的顏色;
矩形集合VECTOR中的外接矩形根據字體輪廓的位置和字體輪廓的顏色在水平方向和垂直方向進行組合生長,得到已經段落分割的字體輪廓;
通過OCR識別引擎,將已經段落分割的字體輪廓生成文字字符。
作為本發明進一步改進的技術方案,所述對原圖像進行清晰度分析處理,包括:
對原圖像進行清晰度檢測并計算原圖像的清晰度,設定清晰度過高閾值與清晰度過低閾值;
將原圖像的清晰度分別與清晰度過高閾值和清晰度過低閾值進行比較從而實現對原圖像進行中值濾波或增強處理;
通過圖像的亮度水平,確定圖像二值化的閾值,對圖像進行自適應二值化。
作為本發明進一步改進的技術方案,所述從圖像的全部輪廓中計算并提取符合字體輪廓的外接矩形,包括:
計算經過清晰度分析處理的圖像的全部輪廓的外接矩形,設定外接矩形的長最大閾值和外接矩形的長最小閾值,設定外接矩形的寬最大閾值和外接矩形的寬最小閾值;
從圖像的全部輪廓的外接矩形中提取符合外接矩形的長的范圍在外接矩形的長最大閾值和外接矩形的長最小閾值之間且外接矩形的寬的范圍在外接矩形的寬最大閾值和外接矩形的寬最小閾值之間的字體輪廓的外接矩形。
作為本發明進一步改進的技術方案,所述通過原圖像的顏色通道提取每個字體輪廓的相應通道分量,包括:
從原圖像的HSV顏色通道與RGB顏色通道來提取每個字體輪廓的相應通道分量,根據HSV顏色通道的分量和RGB顏色通道的分量分析每個字體輪廓的相應通道分量從而提取每個字體輪廓的顏色。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇鴻信系統集成有限公司,未經江蘇鴻信系統集成有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610593389.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種確定信息提示內容的方法與裝置
- 下一篇:圖片檢測的方法和裝置
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





