[發(fā)明專利]一種基于CNN的手寫中文文本識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201811495474.2 | 申請(qǐng)日: | 2018-12-07 |
| 公開(公告)號(hào): | CN109740605A | 公開(公告)日: | 2019-05-10 |
| 發(fā)明(設(shè)計(jì))人: | 何凱;黃婉蓉;馮旭;高圣楠 | 申請(qǐng)(專利權(quán))人: | 天津大學(xué) |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/62 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 李林娟 |
| 地址: | 300072*** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 中文文本 手寫 卷積神經(jīng)網(wǎng)絡(luò) 再利用 分割 中文 二值化處理 單個(gè)文字 橫向掃描 空白像素 框架構(gòu)造 掃描處理 算法結(jié)合 文本圖片 文字分割 自動(dòng)識(shí)別 縱向掃描 灰度化 連接層 訓(xùn)練集 直方圖 池化 構(gòu)建 卷積 投影 圖片 糾正 | ||
1.一種基于CNN的手寫中文文本識(shí)別方法,其特征在于,所述方法將單個(gè)手寫中文識(shí)別與文字分割算法結(jié)合起來,實(shí)現(xiàn)了手寫中文文本的自動(dòng)識(shí)別,所述方法包括以下步驟:
對(duì)文本圖片進(jìn)行灰度化、二值化處理,再利用直方圖投影對(duì)中文文本進(jìn)行分割;先通過橫向掃描分割出單行文字,再利用縱向掃描分割出單個(gè)文字;
對(duì)單個(gè)中文圖片進(jìn)行掃描處理,對(duì)中文進(jìn)行正射糾正,并使其位于圖片中間位置,上下左右各留出10個(gè)空白像素;
基于TensorFlow框架構(gòu)造一個(gè)包括:4個(gè)卷積層、4個(gè)池化層和2個(gè)全連接層的卷積神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練集進(jìn)行訓(xùn)練;輸入待測(cè)圖片,根據(jù)構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識(shí)別。
2.根據(jù)權(quán)利要求1所述的一種基于CNN的手寫中文文本識(shí)別方法,其特征在于,所述4個(gè)卷積層、4個(gè)池化層和2個(gè)全連接層的卷積神經(jīng)網(wǎng)絡(luò)具體為:
layer1為卷積層,采用64個(gè)3×3的卷積核對(duì)輸入圖像做卷積,輸出64個(gè)64×64的特征圖像;
layer2為池化層,輸入layer1的輸出圖像,池化窗口大小為2×2,步長設(shè)為2×2,選擇填充方式為SAME,故64個(gè)大小為64×64的圖像,經(jīng)layer2計(jì)算后輸出為64個(gè)大小為32×32的特征圖像;
layer3為卷積層,采用128個(gè)3×3的卷積核對(duì)layer2的輸出圖像做卷積,輸出是128個(gè)大小為32×32的特征圖像;
layer4為池化層,輸入為layer3的輸出圖像,池化窗口大小為2×2,步長設(shè)為2×2,選擇填充方式為SAME,故128個(gè)大小為32×32的圖像,經(jīng)layer4計(jì)算后輸出為128個(gè)大小為16×16的特征圖像;
layer5為卷積層,采用256個(gè)3×3的卷積核對(duì)layer4的輸出圖像做卷積,輸出是256個(gè)大小為16×16的特征圖像;
layer6為池化層,輸入為layer5的輸出圖像,池化窗口大小為2×2,步長設(shè)為2×2,選擇padding方式為SAME,故256個(gè)大小為16×16的圖像,經(jīng)layer6計(jì)算后輸出為256個(gè)大小為8×8的特征圖像;
layer7為卷積層,采用512個(gè)3×3的卷積核對(duì)layer6的輸出圖像做卷積,輸出是512個(gè)大小為8×8的特征圖像;
layer8為池化層,輸入為layer7的輸出圖像,池化窗口大小為2×2,步長設(shè)為2×2,選擇padding方式為SAME;經(jīng)layer8計(jì)算后輸出為512個(gè)大小為4×4的特征圖像;
layer9為全連接層,輸入為上一層的輸出圖像,輸出為1024個(gè)神經(jīng)元,在進(jìn)入下一層之前,再次做Dropout處理,Dropout率仍為0.8;
layer10為全連接層,輸入為layer9的輸出,輸出為3755個(gè)神經(jīng)元,用于執(zhí)行最終的識(shí)別。
3.根據(jù)權(quán)利要求2所述的一種基于CNN的手寫中文文本識(shí)別方法,其特征在于,
在layer8的輸出圖像進(jìn)入下一個(gè)網(wǎng)絡(luò)層之前,為防止網(wǎng)絡(luò)模型過擬合,先對(duì)layer8的輸出特征圖像做Dropout處理,Dropout率設(shè)為0.8。
4.根據(jù)權(quán)利要求2所述的一種基于CNN的手寫中文文本識(shí)別方法,其特征在于,4個(gè)池化層均采用最大池化計(jì)算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津大學(xué),未經(jīng)天津大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811495474.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于深度學(xué)習(xí)的中文語義分析的方法及裝置
- 手寫模型訓(xùn)練方法、文本識(shí)別方法、裝置、設(shè)備及介質(zhì)
- 用于獲取中文文本要義的方法和裝置
- 一種文本的分詞方法及分詞裝置
- 一種文本處理方法及裝置
- 一種轉(zhuǎn)換中文、英文語言的信息溝通方法及電子設(shè)備
- 結(jié)合RPA與AI的文本標(biāo)注方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種融入偏旁語義的中文文本分類方法
- 中文文本的自動(dòng)糾錯(cuò)方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)
- 一種基于多核雙層卷積神經(jīng)網(wǎng)絡(luò)的中文文本情緒分類方法
- 一種能光學(xué)表現(xiàn)平面手寫面上書寫信息的工具
- 通過使用手寫數(shù)據(jù)再現(xiàn)手寫消息的裝置和方法
- 一種手寫筆跡電子化方法和系統(tǒng)
- 一種發(fā)送手書消息和再現(xiàn)手書消息的方法
- 一種新型無線手寫板
- 一種手寫能力量化評(píng)估系統(tǒng)及方法
- 手寫內(nèi)容去除方法、手寫內(nèi)容去除裝置、存儲(chǔ)介質(zhì)
- 文本圖像中手寫內(nèi)容去除方法、裝置、存儲(chǔ)介質(zhì)
- 一種手寫識(shí)別方法、裝置、電子設(shè)備及介質(zhì)
- 第三方手寫軟件快速手寫的實(shí)現(xiàn)方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 終端卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的圖像深度估計(jì)方法
- 卷積神經(jīng)網(wǎng)絡(luò)的生成方法及裝置
- 一種卷積神經(jīng)網(wǎng)絡(luò)硬件模塊部署方法
- 卷積神經(jīng)網(wǎng)絡(luò)的處理方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法及裝置
- 一種基于通道數(shù)搜索卷積神經(jīng)網(wǎng)絡(luò)的方法
- 卷積神經(jīng)網(wǎng)絡(luò)處理方法、裝置和電子系統(tǒng)
- 一種基于空洞卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的聲音事件檢測(cè)方法
- 基于稀疏卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)方法及檢測(cè)裝置





