[發(fā)明專利]一種高識(shí)別率的光學(xué)字符識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 202111144328.7 | 申請(qǐng)日: | 2021-09-28 |
| 公開(kāi)(公告)號(hào): | CN113869311A | 公開(kāi)(公告)日: | 2021-12-31 |
| 發(fā)明(設(shè)計(jì))人: | 董建偉;方佩;錢(qián)小峰;鮑貞;王濤;陳貴根 | 申請(qǐng)(專利權(quán))人: | 中通服創(chuàng)立信息科技有限責(zé)任公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 王寶筠 |
| 地址: | 610000 四川*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 識(shí)別率 光學(xué) 字符 識(shí)別 方法 | ||
1.一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于包括:
對(duì)待識(shí)別的圖片進(jìn)行裁剪,保留核心區(qū)域;
對(duì)裁剪后的圖片進(jìn)行預(yù)處理;
對(duì)預(yù)處理后的圖片進(jìn)行文字檢測(cè);
基于文字檢測(cè)結(jié)果進(jìn)行文字識(shí)別;
輸出文本文字。
2.根據(jù)權(quán)利要求1所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述對(duì)待識(shí)別的圖片進(jìn)行裁剪包括:
顯示待識(shí)別的圖片;
生成取景模板,對(duì)圖片中的標(biāo)志性圖形進(jìn)行框選;
調(diào)整裁剪框,框選核心區(qū)域;
裁剪。
3.根據(jù)權(quán)利要求2所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于調(diào)整裁剪框的同時(shí)對(duì)裁剪后的圖片進(jìn)行預(yù)覽。
4.根據(jù)權(quán)利要求1所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述對(duì)裁剪后的圖片進(jìn)行預(yù)處理包括:
灰度化、二值化、降噪、核心區(qū)域定位、圖像角度旋轉(zhuǎn)。
5.根據(jù)權(quán)利要求4所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述圖像角度旋轉(zhuǎn)包括:
通過(guò)人臉識(shí)別算法判斷圖片中的頭像位置是否準(zhǔn)確,若不準(zhǔn)確則旋轉(zhuǎn)圖片,直到頭像位置準(zhǔn)確為止。
6.根據(jù)權(quán)利要求1所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述對(duì)預(yù)處理后的圖片進(jìn)行文字檢測(cè)采用CTPN深度學(xué)習(xí)算法實(shí)現(xiàn),包括:
標(biāo)注出圖片中文字所在的區(qū)域;
對(duì)標(biāo)注后的圖片進(jìn)行模型訓(xùn)練,并對(duì)輸出模型進(jìn)行驗(yàn)證。
7.根據(jù)權(quán)利要求6所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述標(biāo)注出圖片中文字所在的區(qū)域,包括:
利用VGG16進(jìn)行圖像分類獲取特征圖;
利用Anchor預(yù)測(cè)對(duì)特征圖中的文字部分進(jìn)行標(biāo)注。
8.根據(jù)權(quán)利要求6所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述對(duì)標(biāo)注后的圖片進(jìn)行模型訓(xùn)練,并對(duì)輸出模型進(jìn)行驗(yàn)證為采用雙向LSTM進(jìn)行模型訓(xùn)練并對(duì)輸出模型進(jìn)行訓(xùn)練。
9.根據(jù)權(quán)利要求1所述的一種高識(shí)別率的光學(xué)字符識(shí)別方法,其特征在于所述基于文字檢測(cè)結(jié)果進(jìn)行文字識(shí)別為采用Densenet深度學(xué)習(xí)算法進(jìn)行文字識(shí)別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中通服創(chuàng)立信息科技有限責(zé)任公司,未經(jīng)中通服創(chuàng)立信息科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111144328.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 基于反識(shí)別渲染的文本內(nèi)容識(shí)別率測(cè)試方法及裝置
- 音段切分檢測(cè)方法及系統(tǒng)、口語(yǔ)評(píng)測(cè)方法及系統(tǒng)
- 一種冠字號(hào)識(shí)別率確定方法及裝置
- 一種基于分子光譜分析的定性模型評(píng)估方法和系統(tǒng)
- 從非結(jié)構(gòu)化文本中提取特征詞的方法及系統(tǒng)、計(jì)算機(jī)程序
- 一種人臉識(shí)別系統(tǒng)的自我糾正方法、系統(tǒng)及設(shè)備
- 權(quán)重精度配置方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的中藥材識(shí)別方法
- 用于訓(xùn)練集的噪聲數(shù)據(jù)修改方法、裝置和電子設(shè)備
- 用于訓(xùn)練集的噪聲數(shù)據(jù)識(shí)別方法、裝置和電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





