[發明專利]一種增強OCR性能的背景圖像消除方法有效
| 申請號: | 202010331452.3 | 申請日: | 2020-04-24 |
| 公開(公告)號: | CN111612705B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 肖學中;葉子卿 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06T5/00 | 分類號: | G06T5/00;G06T7/90 |
| 代理公司: | 南京蘇科專利代理有限責任公司 32102 | 代理人: | 陳棟智 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 增強 ocr 性能 背景 圖像 消除 方法 | ||
1.一種增強OCR性能的背景圖像消除方法,其特征在于:包括以下步驟:
步驟一:將圖片中像素和背景圖像像素間的差異分解為亮度和色度;
步驟二:對所輸入的圖像計算像素亮度失真,所述亮度失真αi由最小化下述函數而得到:
其中,pi代表當前圖像像素,ei代表背景圖像像素,αi代表像素相對期望值的亮度增強;為最小化函數值,設定當前圖像和參考圖像亮度相同時αi為1,同樣的,αi<1代表比期望亮度要暗,αi>1代表比期望亮度要亮;
步驟三:對所輸入的圖像計算像素色度失真,所述色度失真βi定義為觀察到的顏色與期望色度線之間的正交距離,可以由如下公式表示:
βi=||pi-αiei||
其中,pi代表當前圖像像素,ei代表背景圖像像素,αi代表步驟二中確定的亮度失真值;
步驟四:基于像素的亮度失真和色度失真分別對RGB三通道圖像進行增強;
步驟五:將增強后的RGB三通道圖像合并成灰度圖像。
2.根據權利要求1所述的一種增強OCR性能的背景圖像消除方法,其特征在于:步驟一中所述分解像素和背景圖像像素方法基于以下兩種觀察結果:
(1)與純文本字符相比,背景圖像的紋理和圖案分布更豐富;
(2)彩色背景圖像中每個像素的RGB值差異較大,對于文本字符RGB值的差異并不顯著。
3.根據權利要求1所述的一種增強OCR性能的背景圖像消除方法,其特征在于:步驟一中所述分解像素和背景圖像像素方法具體包括:
將圖片像素和背景圖像像素分解為亮度αi和色度βi,利用αi和βi的統計差異來作為參數估計,用以增強文檔圖像。
4.根據權利要求1所述的一種增強OCR性能的背景圖像消除方法,其特征在于:步驟四中所述圖像增強方法在不改變前景文本的情況下去除顏色背景,并確保每個像素有R、G和B三個值;如果原始圖像沒有在RGB的顏色空間中表示,則需要轉換為RGB。
5.根據權利要求1所述的一種增強OCR性能的背景圖像消除方法,其特征在于:步驟四中所述圖像增強方法使用非線性變換來增強每個通道圖像的對比度,在保持灰度像素的同時擴大彩色像素的色差,可以由如下公式表示:
qi=max{0,min[255,(pi-128)*βi+αi]}
其中pi為原始像素值,qi為調整后像素值,亮度αi用來調整圖像的亮度。
6.根據權利要求1所述的一種增強OCR性能的背景圖像消除方法,其特征在于:步驟五中所述圖像通道合并方法用于將三個通道的圖像合并成一個灰度圖像,如下公式所示:
S=|r-g|+|r-b|+|g-b|
其中,r,g,b分別為通道圖像增強后的紅、綠、藍值,S是三者間差值的和,在此基礎上,根據不同文檔的特性設定一個閾值T;如果S>T,則:
fi=min[255,(r+g+b)]
否則,若S≤T:
fi=min[255,(r+g+b)/3]
其中fi為合并后的像素值。
7.根據權利要求1所述的一種增強OCR性能的背景圖像消除方法,其特征在于:步驟五中所述圖像通道合并方法得到合并像素值之后,如果像素仍屬于彩色背景圖像,則再次放大像素值,最終得到灰度圖像;其中,背景圖像像素值接近255,文本圖像像素值接近0。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010331452.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙溫空調系統、控制方法和空調器
- 下一篇:雙溫空調系統、控制方法和空調器





