[發(fā)明專利]文字圖像的處理方法和裝置、電子設(shè)備、計(jì)算機(jī)存儲介質(zhì)有效
| 申請?zhí)枺?/td> | 201711039709.2 | 申請日: | 2017-10-30 |
| 公開(公告)號: | CN108230332B | 公開(公告)日: | 2021-05-04 |
| 發(fā)明(設(shè)計(jì))人: | 張杰;梁鼎 | 申請(專利權(quán))人: | 北京市商湯科技開發(fā)有限公司 |
| 主分類號: | G06T7/11 | 分類號: | G06T7/11;G06T5/00;G06N3/08 |
| 代理公司: | 北京思源智匯知識產(chǎn)權(quán)代理有限公司 11657 | 代理人: | 毛麗琴 |
| 地址: | 100084 北京市海淀區(qū)中*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文字 圖像 處理 方法 裝置 電子設(shè)備 計(jì)算機(jī) 存儲 介質(zhì) | ||
本發(fā)明實(shí)施例公開了一種文字圖像的處理方法和裝置、電子設(shè)備、計(jì)算機(jī)存儲介質(zhì),其中,方法包括:將接收到的待處理文字圖像處理為黑白圖像;通過渲染網(wǎng)絡(luò)對所述黑白圖像進(jìn)行背景渲染,得到渲染后的渲染文字圖像;所述渲染網(wǎng)絡(luò)基于文字圖像樣本集結(jié)合判別網(wǎng)絡(luò)預(yù)先訓(xùn)練獲得,所述文字圖像樣本集包括真實(shí)的樣本文字圖像以及所述真實(shí)的樣本文字圖像經(jīng)過背景渲染獲得的渲染樣本文字圖像。本發(fā)明上述實(shí)施例,由于采用訓(xùn)練好的渲染網(wǎng)絡(luò),實(shí)現(xiàn)了為黑白圖像渲染了較為真實(shí)的背景紋理,實(shí)現(xiàn)了獲得與真實(shí)圖像差異較小的渲染文字圖像。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像處理技術(shù),尤其是一種文字圖像的處理方法和裝置、電子設(shè)備、計(jì)算機(jī)存儲介質(zhì)。
背景技術(shù)
基于深度學(xué)習(xí)的文字識別算法需要大量的樣本數(shù)據(jù)進(jìn)行訓(xùn)練,通過人工采集和標(biāo)注這些樣本數(shù)據(jù)需要花費(fèi)極高的人力成本;同時由于字典中的文字在現(xiàn)實(shí)生活中出現(xiàn)的頻率差異較大,往往很難采集到一些生僻字的文字圖像,這對文字識別算法的訓(xùn)練也會造成一定的影響。因此人工生成用于文字識別的數(shù)據(jù)不僅可以極大地節(jié)省成本,而且也能豐富數(shù)據(jù)集,訓(xùn)練更好的模型;然而實(shí)際采集到的文字圖像往往會有不同的背景紋理,文字的模糊程度也不一致,還存在光照、拍攝角度等各種因素影響采集到的文字圖像。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種文字圖像的處理技術(shù)。
本發(fā)明實(shí)施例提供的一種文字圖像的處理方法,包括:
將接收到的待處理文字圖像處理為黑白圖像;
通過渲染網(wǎng)絡(luò)對所述黑白圖像進(jìn)行背景渲染,得到渲染后的渲染文字圖像;所述渲染網(wǎng)絡(luò)基于文字圖像樣本集結(jié)合判別網(wǎng)絡(luò)預(yù)先訓(xùn)練獲得,所述文字圖像樣本集包括真實(shí)樣本文字圖像以及所述真實(shí)樣本文字圖像經(jīng)過背景渲染獲得的渲染樣本文字圖像,所述判別網(wǎng)絡(luò)用于識別接收的文字圖像的真實(shí)率,所述真實(shí)率表示所述渲染文字圖像和所述文字圖像樣本集中的圖像是真實(shí)圖像的概率。
在基于本發(fā)明上述方法的另一個實(shí)施例中,所述將接收到的待處理文字圖像處理為黑白圖像,包括:
將接收到的待處理文字圖像轉(zhuǎn)換為灰度圖,基于所述轉(zhuǎn)換得到的灰度圖計(jì)算獲得自適應(yīng)閾值;
基于所述自適應(yīng)閾值對所述灰度圖進(jìn)行二值化處理,得到所述黑白圖像。
在基于本發(fā)明上述方法的另一個實(shí)施例中,基于所述自適應(yīng)閾值對所述灰度圖進(jìn)行二值化處理,包括:
將所述灰度圖中大于或等于所述自適應(yīng)閾值的像素對應(yīng)像素值設(shè)置為255,將所述灰度圖中小于所述自適應(yīng)閾值的像素對應(yīng)像素值設(shè)置為0;
或?qū)⑺龌叶葓D中大于或等于所述自適應(yīng)閾值的像素對應(yīng)像素值設(shè)置為0,將所述灰度圖中小于所述自適應(yīng)閾值的像素對應(yīng)像素值設(shè)置為255。
在基于本發(fā)明上述方法的另一個實(shí)施例中,通過渲染網(wǎng)絡(luò)對所述黑白圖像進(jìn)行背景渲染之前,還包括:
保持所述黑白圖像的寬高比不變,對所述黑白圖像進(jìn)行縮放,將所述黑白圖像的高度縮放為設(shè)定值,將所述黑白圖像的寬度縮放為設(shè)定值的整數(shù)倍。
在基于本發(fā)明上述方法的另一個實(shí)施例中,將所述黑白圖像的寬度縮放為設(shè)定像素值的整數(shù)倍,包括:
當(dāng)所述黑白圖像經(jīng)過縮放,得到縮放后的寬度值不為所述設(shè)定值的整數(shù)倍時,通過反映填充的方式將所述寬度值補(bǔ)全到所述設(shè)定值的整數(shù)倍。
在基于本發(fā)明上述方法的另一個實(shí)施例中,所述通過反映填充的方式將所述寬度值補(bǔ)全到所述設(shè)定值的整數(shù)倍,包括:
從所述經(jīng)過縮放的黑白圖像的最右列像素開始按照從左到右的順序補(bǔ)充至少1列像素,使補(bǔ)充所述至少1列像素后的寬度值為所述設(shè)定值的整數(shù)倍;所述至少1列像素包括從所述最右列像素開始從右到左選取的至少1列像素,在補(bǔ)充過程中,將先選取的像素先插入。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京市商湯科技開發(fā)有限公司,未經(jīng)北京市商湯科技開發(fā)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711039709.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





