[發(fā)明專利]基于自動編碼器的文字識別方法、裝置及計算機(jī)設(shè)備在審
| 申請?zhí)枺?/td> | 201711047604.1 | 申請日: | 2017-10-31 |
| 公開(公告)號: | CN109726719A | 公開(公告)日: | 2019-05-07 |
| 發(fā)明(設(shè)計)人: | 龍學(xué)珠 | 申請(專利權(quán))人: | 比亞迪股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/40;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 518118 廣東省*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 文字識別 自動編碼器 圖像 計算機(jī)設(shè)備 文字圖像 準(zhǔn)確度 圖像處理 用戶使用 預(yù)先生成 去噪 字跡 保證 | ||
本發(fā)明提出一種基于自動編碼器的文字識別方法、裝置及計算機(jī)設(shè)備,其中方法包括:利用預(yù)先生成的自動編碼器,對待識別的圖像進(jìn)行去噪處理,獲取待識別的圖像中包括的文字圖像;對文字圖像進(jìn)行文字識別,確定待識別的圖像中的文字。該方法不僅節(jié)省了圖像處理時間,還保證了處理后的文字字跡完整,從而使得圖像中的文字識別準(zhǔn)確度更高,提高了用戶使用體驗。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,尤其涉及一種基于自動編碼器的文字識別方法、裝置及計算機(jī)設(shè)備。
背景技術(shù)
目前,對圖像中的文字進(jìn)行識別時,通常是先對圖像進(jìn)行預(yù)處理,以去除圖像中文字包含的各種類型噪聲,然后再對去除噪聲的圖像進(jìn)行文字識別操作。
在實際應(yīng)用過程中,對圖像進(jìn)行去噪處理時,一般都是通過傳統(tǒng)的圖像處理技術(shù)中的圖像濾波算法、圖像增強(qiáng)以及縮放操作,去除圖像中的噪點,以突出圖像中的文字部分。然而發(fā)明人發(fā)現(xiàn),通過上述方式對圖像進(jìn)行去噪處理時,不僅需要花費(fèi)大量時間對圖像濾波參數(shù)進(jìn)行調(diào)節(jié),甚至還有可能導(dǎo)致處理后的文字字跡出現(xiàn)丟失,從而影響文字識別的正確率,使得文字識別準(zhǔn)確度低。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的第一個目的在于提出一種基于自動編碼器的文字識別方法。該方法不僅節(jié)省了圖像處理時間,還保證了處理后的文字字跡完整,從而使得圖像中的文字識別準(zhǔn)確度更高,提高了用戶使用體驗。
本發(fā)明的第二個目的在于提出一種基于自動編碼器的文字識別裝置。
本發(fā)明的第三個目的在于提出一種計算機(jī)設(shè)備。
本發(fā)明的第四個目的在于提出一種計算機(jī)可讀存儲介質(zhì)。
為達(dá)上述目的,本發(fā)明第一方面實施例提出了一種基于自動編碼器的文字識別方法,包括:
利用預(yù)先生成的自動編碼器,對待識別的圖像進(jìn)行去噪處理,獲取所述待識別的圖像中包括的文字圖像;
對所述文字圖像進(jìn)行文字識別,確定所述待識別的圖像中的文字。
本實施例提供的基于自動編碼器的文字識別方法中,通過利用預(yù)先生成的自動編碼器,對待識別的圖像進(jìn)行去噪處理,以獲取待識別圖像中包括的文字圖像,然后對文字圖像進(jìn)行文字識別,以確定出待識別的圖像中的文字。由此,實現(xiàn)了對圖像中的文字進(jìn)行識別時,不僅節(jié)省了圖像處理時間,還保證了處理后的文字字跡完整,從而使得圖像中的文字識別準(zhǔn)確度更高,提高了用戶使用體驗。
另外,本發(fā)明上述實施例提出的基于自動編碼器的文字識別方法還可以具有如下附加的技術(shù)特征:
在本發(fā)明的一個實施例中,所述利用預(yù)先生成的自動編碼器,對待識別的圖像進(jìn)行去噪處理之前,還包括:
獲取訓(xùn)練圖像集,其中所述訓(xùn)練圖像集中包括文字圖像子集及原始圖像子集,所述原始圖像由文字圖像及噪聲組成;
利用所述文字圖像子集及原始圖像子集,對預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,生成所述自動編碼器。
在本發(fā)明的另一個實施例中,所述預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)包括卷積層、下采樣層及上采樣層,其中,所述下采樣層與所述上采樣層對稱設(shè)置。
在本發(fā)明的另一個實施例中,所述對預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,生成所述自動編碼器,包括:
對所述預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,確定所述卷積神經(jīng)網(wǎng)絡(luò)中各卷積層中卷積核的值。
在本發(fā)明的另一個實施例中,所述獲取訓(xùn)練圖像集,包括:
獲取文字圖像子集;
將所述文字圖像子集分別進(jìn)行噪聲混疊,生成所述原始圖像子集。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于比亞迪股份有限公司,未經(jīng)比亞迪股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711047604.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于太赫茲光譜與深度自動編碼器的土壤重金屬元素含量預(yù)測方法
- 基于層次化自動編碼器的SAR圖像分類方法及裝置
- 一種基于約束條件的堆疊步進(jìn)自編碼器的正面人臉重建系統(tǒng)及方法
- 一種基于修復(fù)自動編碼器殘差的異常人臉檢測方法
- 一種基于去噪自動編碼器的BCG信號降噪方法及裝置
- 一種基于自動編碼器的水聲信號增強(qiáng)方法
- 基于沙漏卷積自動編碼神經(jīng)網(wǎng)絡(luò)的跌倒檢測方法
- 基于多層堆棧式自動編碼器的高光譜圖像解混方法
- 用于自動編碼器產(chǎn)生的遺傳算法和優(yōu)化訓(xùn)練器的協(xié)作使用
- 一種重優(yōu)化深度自動編碼器及發(fā)動機(jī)自動檢測系統(tǒng)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





