[發明專利]文字圖像的處理方法和裝置、電子設備、計算機存儲介質有效
| 申請號: | 201711039709.2 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN108230332B | 公開(公告)日: | 2021-05-04 |
| 發明(設計)人: | 張杰;梁鼎 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T5/00;G06N3/08 |
| 代理公司: | 北京思源智匯知識產權代理有限公司 11657 | 代理人: | 毛麗琴 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字 圖像 處理 方法 裝置 電子設備 計算機 存儲 介質 | ||
1.一種文字圖像的處理方法,其特征在于,包括:
將接收到的待處理文字圖像處理為黑白圖像;
通過渲染網絡對所述黑白圖像進行背景渲染,得到渲染后的渲染文字圖像;所述渲染網絡基于文字圖像樣本集結合判別網絡預先訓練獲得,所述文字圖像樣本集包括真實樣本文字圖像以及所述真實樣本文字圖像經過背景渲染獲得的渲染樣本文字圖像,所述判別網絡用于識別接收的文字圖像的真實率,所述真實率表示所述渲染文字圖像和所述文字圖像樣本集中的圖像是真實圖像的概率;
將所述得到的渲染文字圖像作為樣本圖像;或將所述得到的渲染文字圖像和真實文字圖像作為樣本圖像;
基于所述樣本圖像訓練文字識別網絡;所述文字識別網絡用于識別樣本圖像中的文字內容。
2.根據權利要求1所述的方法,其特征在于,所述將接收到的待處理文字圖像處理為黑白圖像,包括:
將接收到的待處理文字圖像轉換為灰度圖,基于所述轉換得到的灰度圖計算獲得自適應閾值;
基于所述自適應閾值對所述灰度圖進行二值化處理,得到所述黑白圖像。
3.根據權利要求2所述的方法,其特征在于,基于所述自適應閾值對所述灰度圖進行二值化處理,包括:
將所述灰度圖中大于或等于所述自適應閾值的像素對應像素值設置為255,將所述灰度圖中小于所述自適應閾值的像素對應像素值設置為0;
或將所述灰度圖中大于或等于所述自適應閾值的像素對應像素值設置為0,將所述灰度圖中小于所述自適應閾值的像素對應像素值設置為255。
4.根據權利要求1所述的方法,其特征在于,通過渲染網絡對所述黑白圖像進行背景渲染之前,還包括:
保持所述黑白圖像的寬高比不變,對所述黑白圖像進行縮放,將所述黑白圖像的高度縮放為設定值,將所述黑白圖像的寬度縮放為設定值的整數倍。
5.根據權利要求4所述的方法,其特征在于,將所述黑白圖像的寬度縮放為設定像素值的整數倍,包括:
當所述黑白圖像經過縮放,得到縮放后的寬度值不為所述設定值的整數倍時,通過反映填充的方式將所述寬度值補全到所述設定值的整數倍。
6.根據權利要求5所述的方法,其特征在于,所述通過反映填充的方式將所述寬度值補全到所述設定值的整數倍,包括:
從所述經過縮放的黑白圖像的最右列像素開始按照從左到右的順序補充至少1列像素,使補充所述至少1列像素后的寬度值為所述設定值的整數倍;所述至少1列像素包括從所述最右列像素開始從右到左選取的至少1列像素,在補充過程中,將先選取的像素先插入。
7.根據權利要求1-6任一所述的方法,其特征在于,還包括:
將所述渲染文字圖像和所述接收到的待處理文字圖像輸入判別網絡;
經所述判別網絡輸出所述渲染文字圖像和所述接收到的待處理文字圖像的真實率;
基于所述真實率獲取所述渲染文字圖像與所述接收到的待處理文字圖像之間的誤差值;所述誤差值表示所述渲染文字圖像與所述接收到的待處理文字圖像在像素值上的差異;
基于所述誤差值訓練所述渲染網絡和所述判別網絡,直到滿足預設停止訓練條件。
8.根據權利要求7所述的方法,其特征在于,經所述判別網絡輸出所述渲染文字圖像的真實率,包括:
對所述渲染文字圖像基于高度和寬度分解為至少一個渲染區域,基于所述判別網絡輸出分別對應各所述渲染區域的區域真實率;對各所述區域真實率求平均,獲取對應所述渲染文字圖像的真實率。
9.根據權利要求8所述的方法,其特征在于,各所述渲染區域大小相同,所述渲染區域的高度和寬度相同。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711039709.2/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





