[發(fā)明專利]基于自動編碼器的文字識別方法、裝置及計算機(jī)設(shè)備在審

申請?zhí)枺?/td>	201711047604.1	申請日：	2017-10-31
公開（公告）號：	CN109726719A	公開（公告）日：	2019-05-07
發(fā)明（設(shè)計）人：	龍學(xué)珠	申請（專利權(quán)）人：	比亞迪股份有限公司
主分類號：	G06K9/34	分類號：	G06K9/34;G06K9/40;G06N3/04;G06N3/08
代理公司：	北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201	代理人：	張潤
地址：	518118 廣東省***	國省代碼：	廣東;44
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	文字識別自動編碼器圖像計算機(jī)設(shè)備文字圖像準(zhǔn)確度圖像處理用戶使用預(yù)先生成去噪字跡保證
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明提出一種基于自動編碼器的文字識別方法、裝置及計算機(jī)設(shè)備，其中方法包括：利用預(yù)先生成的自動編碼器，對待識別的圖像進(jìn)行去噪處理，獲取待識別的圖像中包括的文字圖像；對文字圖像進(jìn)行文字識別，確定待識別的圖像中的文字。該方法不僅節(jié)省了圖像處理時間，還保證了處理后的文字字跡完整，從而使得圖像中的文字識別準(zhǔn)確度更高，提高了用戶使用體驗。

技術(shù)領(lǐng)域

本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域，尤其涉及一種基于自動編碼器的文字識別方法、裝置及計算機(jī)設(shè)備。

背景技術(shù)

目前，對圖像中的文字進(jìn)行識別時，通常是先對圖像進(jìn)行預(yù)處理，以去除圖像中文字包含的各種類型噪聲，然后再對去除噪聲的圖像進(jìn)行文字識別操作。

在實際應(yīng)用過程中，對圖像進(jìn)行去噪處理時，一般都是通過傳統(tǒng)的圖像處理技術(shù)中的圖像濾波算法、圖像增強(qiáng)以及縮放操作，去除圖像中的噪點，以突出圖像中的文字部分。然而發(fā)明人發(fā)現(xiàn)，通過上述方式對圖像進(jìn)行去噪處理時，不僅需要花費(fèi)大量時間對圖像濾波參數(shù)進(jìn)行調(diào)節(jié)，甚至還有可能導(dǎo)致處理后的文字字跡出現(xiàn)丟失，從而影響文字識別的正確率，使得文字識別準(zhǔn)確度低。

發(fā)明內(nèi)容

本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。

為此，本發(fā)明的第一個目的在于提出一種基于自動編碼器的文字識別方法。該方法不僅節(jié)省了圖像處理時間，還保證了處理后的文字字跡完整，從而使得圖像中的文字識別準(zhǔn)確度更高，提高了用戶使用體驗。

本發(fā)明的第二個目的在于提出一種基于自動編碼器的文字識別裝置。

本發(fā)明的第三個目的在于提出一種計算機(jī)設(shè)備。

本發(fā)明的第四個目的在于提出一種計算機(jī)可讀存儲介質(zhì)。

為達(dá)上述目的，本發(fā)明第一方面實施例提出了一種基于自動編碼器的文字識別方法，包括：

利用預(yù)先生成的自動編碼器，對待識別的圖像進(jìn)行去噪處理，獲取所述待識別的圖像中包括的文字圖像；

對所述文字圖像進(jìn)行文字識別，確定所述待識別的圖像中的文字。

本實施例提供的基于自動編碼器的文字識別方法中，通過利用預(yù)先生成的自動編碼器，對待識別的圖像進(jìn)行去噪處理，以獲取待識別圖像中包括的文字圖像，然后對文字圖像進(jìn)行文字識別，以確定出待識別的圖像中的文字。由此，實現(xiàn)了對圖像中的文字進(jìn)行識別時，不僅節(jié)省了圖像處理時間，還保證了處理后的文字字跡完整，從而使得圖像中的文字識別準(zhǔn)確度更高，提高了用戶使用體驗。

另外，本發(fā)明上述實施例提出的基于自動編碼器的文字識別方法還可以具有如下附加的技術(shù)特征：

在本發(fā)明的一個實施例中，所述利用預(yù)先生成的自動編碼器，對待識別的圖像進(jìn)行去噪處理之前，還包括：

獲取訓(xùn)練圖像集，其中所述訓(xùn)練圖像集中包括文字圖像子集及原始圖像子集，所述原始圖像由文字圖像及噪聲組成；

利用所述文字圖像子集及原始圖像子集，對預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，生成所述自動編碼器。

在本發(fā)明的另一個實施例中，所述預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)包括卷積層、下采樣層及上采樣層，其中，所述下采樣層與所述上采樣層對稱設(shè)置。

在本發(fā)明的另一個實施例中，所述對預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，生成所述自動編碼器，包括：

對所述預(yù)設(shè)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，確定所述卷積神經(jīng)網(wǎng)絡(luò)中各卷積層中卷積核的值。

在本發(fā)明的另一個實施例中，所述獲取訓(xùn)練圖像集，包括：

獲取文字圖像子集；

將所述文字圖像子集分別進(jìn)行噪聲混疊，生成所述原始圖像子集。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于比亞迪股份有限公司，未經(jīng)比亞迪股份有限公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201711047604.1/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。