[發明專利]基于自動編碼器的文字識別方法、裝置及計算機設備在審
| 申請號: | 201711047604.1 | 申請日: | 2017-10-31 |
| 公開(公告)號: | CN109726719A | 公開(公告)日: | 2019-05-07 |
| 發明(設計)人: | 龍學珠 | 申請(專利權)人: | 比亞迪股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/40;G06N3/04;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張潤 |
| 地址: | 518118 廣東省*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字識別 自動編碼器 圖像 計算機設備 文字圖像 準確度 圖像處理 用戶使用 預先生成 去噪 字跡 保證 | ||
1.一種基于自動編碼器的文字識別方法,其特征在于,包括:
利用預先生成的自動編碼器,對待識別的圖像進行去噪處理,獲取所述待識別的圖像中包括的文字圖像;
對所述文字圖像進行文字識別,確定所述待識別的圖像中的文字。
2.如權利要求1所述的方法,其特征在于,所述利用預先生成的自動編碼器,對待識別的圖像進行去噪處理之前,還包括:
獲取訓練圖像集,其中所述訓練圖像集中包括文字圖像子集及原始圖像子集,所述原始圖像由文字圖像及噪聲組成;
利用所述文字圖像子集及原始圖像子集,對預設的卷積神經網絡進行訓練,生成所述自動編碼器。
3.如權利要求2所述的方法,其特征在于,所述預設的卷積神經網絡包括卷積層、下采樣層及上采樣層,其中,所述下采樣層與所述上采樣層對稱設置。
4.如權利要求2所述的方法,其特征在于,所述對預設的卷積神經網絡進行訓練,生成所述自動編碼器,包括:
對所述預設的卷積神經網絡進行訓練,確定所述卷積神經網絡中各卷積層中卷積核的值。
5.如權利要求2-4任一所述的方法,其特征在于,所述獲取訓練圖像集,包括:
獲取文字圖像子集;
將所述文字圖像子集分別進行噪聲混疊,生成所述原始圖像子集。
6.一種基于自動編碼器的文字識別裝置,其特征在于,包括:
第一獲取模塊,用于利用預先生成的自動編碼器,對待識別的圖像進行去噪處理,獲取所述待識別的圖像中包括的文字圖像;
確定模塊,用于對所述文字圖像進行文字識別,確定所述待識別的圖像中的文字。
7.如權利要求6所述的裝置,其特征在于,還包括:
第二獲取模塊,用于獲取訓練圖像集,其中所述訓練圖像集中包括文字圖像子集及原始圖像子集,所述原始圖像由文字圖像及噪聲組成;
生成模塊,用于利用所述文字圖像子集及原始圖像子集,對預設的卷積神經網絡進行訓練,生成所述自動編碼器。
8.如權利要求7所述的裝置,其特征在于,所述生成模塊具體包括:
對所述預設的卷積神經網絡進行訓練,確定所述卷積神經網絡中各卷積層中卷積核的值。
9.一種計算機設備,其特征在于,包括:存儲器、處理器及通信端口;
所述通信端口,用于輸入輸出待識別圖像的數據;
所述存儲器,用于存儲可執行程序代碼;
所述處理器,用于讀取所述存儲器中存儲的可執行程序代碼來運行與所述可執行程序代碼對應的程序,以用于實現如權利要求1-5任一所述的基于自動編碼器的文字識別方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-5任一所述的基于自動編碼器的文字識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于比亞迪股份有限公司,未經比亞迪股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711047604.1/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





