[發明專利]基于圖像識別技術的彩色圖像文字段落分割與識別方法有效

申請號：	201610593389.4	申請日：	2016-07-26
公開（公告）號：	CN106228157B	公開（公告）日：	2018-03-27
發明（設計）人：	車少帥;于志文;邵一婷;胡笳	申請（專利權）人：	江蘇鴻信系統集成有限公司
主分類號：	G06K9/20	分類號：	G06K9/20;G06K9/46
代理公司：	南京鐘山專利代理有限公司32252	代理人：	戴朝榮
地址：	210005 ***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	基于圖像識別技術彩色文字段落分割方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

技術領域

本發明屬于圖像處理領域，尤其涉及一種基于圖像識別技術的彩色圖像文字段落分割與識別方法。

背景技術

從人們最開始提出相應的概念到現在，OCR(Optical Character Recognition，光學字符識別)技術經歷了近一個世紀的發展，現在，對于背景簡單的文本，可高效準確的將其轉化成可為計算機讀懂的電子文本。隨著技術發展的越來越成熟，應用面越來越廣，市場需求越來越大，各種文字識別的軟件和工具相繼推出。然而，經典的文字識別技術只針對通過掃描得到的背景簡單、分辨率和對比度高的圖像有理想的識別率。但是，現實生活中有很多帶有文字的場景，比如票據圖像、證件圖像、飯店菜單圖像、產品傳單圖像、路牌、車站牌、店名、商品簡介等,想要獲得這些處于自然場景中的文字,依靠掃描的方式顯然并不太實際，而且大量圖片數據的存儲占用很大的存儲空間，圖像內的寶貴數據因為圖像的丟失而丟失等缺陷需要人們使用文字提取技術來解決這一問題。目前,雖然有很多針對自然場景中文本識別的研究，但其結果并不如人們期望中的理想。一般通過拍攝設備獲得的圖片分為帶有自然場景的圖片和純文字圖片。由于自然場景的復雜性，造成了處于其中的文字背景相當復雜，還由于拍攝地點、拍攝角度和光線強弱等各種原因造成的文字的字體、大小、對比度以及亮度等不均勻,增大了定位文本區域的難度，直接影響了文字區域定位的準確性和字符識別的結果的準確性；因此研究日常生活中所遇到的復雜背景下彩色圖像中文字的準確的提取與準確的識別，有著重要的意義。

然而，在文字識別領域如何準確快速提取到彩色圖像中的文字字段還有待進一步研究開發，現有技術中還有部分涉及這方面的技術領域，但是都存在一定不足，例如，對于有些字體的提取技術，雖然能獲取到圖像中文字字段，但并不準確；在字體組合技術方面，現有技術大多只考慮位置關系而忽略了字體其他信息，如顏色等，只考慮文字的位置從而無法排除背景顏色對文字的干擾作用，準確性還會降低。

發明內容

本發明所要解決的技術問題是針對上述現有技術的不足提供一種基于圖像識別技術的彩色圖像文字段落分割與識別方法，本發明基于圖像識別技術的彩色圖像文字段落分割與識別方法能快速識別圖像中主要的文字輪廓，通過字體輪廓的位置和顏色從而準確的提取彩色圖像中的文字數據，將提取的文字數據保存起來，解決了海量圖片數據存儲的壓力的問題，以及解決了因為圖像的丟失而丟失圖像內的寶貴文字數據的問題。

為實現上述技術目的，本發明采取的技術方案為：

基于圖像識別技術的彩色圖像文字段落分割與識別方法，包括：

對原圖像進行清晰度分析處理，提取圖像的全部輪廓和全部輪廓所在的位置；

從圖像的全部輪廓中計算并提取符合字體輪廓的外接矩形，將每個字體輪廓的外接矩形，保存到矩形集合VECTOR中；

通過原圖像的顏色通道提取每個字體輪廓的相應通道分量，分析并提取每個字體輪廓的顏色；

矩形集合VECTOR中的外接矩形根據字體輪廓的位置和字體輪廓的顏色在水平方向和垂直方向進行組合生長，得到已經段落分割的字體輪廓；

通過OCR識別引擎，將已經段落分割的字體輪廓生成文字字符。

作為本發明進一步改進的技術方案，所述對原圖像進行清晰度分析處理，包括：

對原圖像進行清晰度檢測并計算原圖像的清晰度，設定清晰度過高閾值與清晰度過低閾值；

將原圖像的清晰度分別與清晰度過高閾值和清晰度過低閾值進行比較從而實現對原圖像進行中值濾波或增強處理；

通過圖像的亮度水平，確定圖像二值化的閾值，對圖像進行自適應二值化。

作為本發明進一步改進的技術方案，所述從圖像的全部輪廓中計算并提取符合字體輪廓的外接矩形，包括：