[發(fā)明專利]基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的水書文字識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201910217488.6 | 申請(qǐng)日: | 2019-03-21 |
| 公開(公告)號(hào): | CN110348280A | 公開(公告)日: | 2019-10-18 |
| 發(fā)明(設(shè)計(jì))人: | 丁瓊 | 申請(qǐng)(專利權(quán))人: | 貴州工業(yè)職業(yè)技術(shù)學(xué)院 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 貴陽中新專利商標(biāo)事務(wù)所 52100 | 代理人: | 商小川 |
| 地址: | 551400 貴州省*** | 國省代碼: | 貴州;52 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 神經(jīng)網(wǎng)絡(luò) 文字識(shí)別 樣本 神經(jīng)網(wǎng)絡(luò)模型 文字識(shí)別技術(shù) 算法實(shí)現(xiàn) 特征提取 準(zhǔn)確率 采集 分類 檢測(cè) | ||
本發(fā)明公開了一種基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的水書文字識(shí)別方法,它包括步驟1、采集水書文字樣本;步驟2、采用基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)模型對(duì)水書文字樣本進(jìn)行特征提取和分類;步驟3、采用YOLO算法實(shí)現(xiàn)水書字符的定位與檢測(cè);解決了現(xiàn)有技術(shù)中通過常規(guī)文字識(shí)別技術(shù)識(shí)別水書文字存在準(zhǔn)確率低下等問題。
技術(shù)領(lǐng)域
本發(fā)明屬于文字識(shí)別技術(shù),尤其涉及一種基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的水書文字識(shí)別方法。
背景技術(shù):
在計(jì)算機(jī)視覺領(lǐng)域,物體識(shí)別和定位一直是一個(gè)重要研究方向,對(duì)水書文字的識(shí)別也正是屬于這一范疇的問題,由于水書文字屬于象形文字,為非標(biāo)準(zhǔn)化文字,在收集的水書樣本中,幾乎都是手寫的水書資料,同一個(gè)字不同的人寫出來差別可能很大,還有很多水書文字都是和其他文字(例如:漢字)混編在一起,從一個(gè)混編文獻(xiàn)中準(zhǔn)確識(shí)別出水書文字,而不誤識(shí)別其它文字或圖案,這對(duì)字符分割、定位與檢測(cè),及字符特征提取與分類算法都提出了很高的要求;另外,由于水書文字與自然圖片相比較在特征上有極大的不同,而通常神經(jīng)網(wǎng)絡(luò)都是在ImageNet等通用的圖像分類數(shù)據(jù)集上進(jìn)行的預(yù)訓(xùn)練,普通的神經(jīng)網(wǎng)絡(luò)很難泛化這些特征上的區(qū)別;因此采用現(xiàn)有技術(shù)的文字識(shí)別方法識(shí)別水書文字存在準(zhǔn)確率低下等問題。
發(fā)明內(nèi)容:
本發(fā)明要解決的技術(shù)問題:提供一種基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的水書文字識(shí)別方法,以解決現(xiàn)有技術(shù)中通過常規(guī)文字識(shí)別技術(shù)識(shí)別水書文字存在準(zhǔn)確率低下等問題。
本發(fā)明的技術(shù)方案:
一種基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的水書文字識(shí)別方法,它包括:
步驟1、采集水書文字樣本;
步驟2、采用基于CNN結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)模型對(duì)水書文字樣本進(jìn)行特征提取和分類;
步驟3、采用YOLO算法實(shí)現(xiàn)水書字符的定位與檢測(cè)。
步驟3所述采用YOLO算法實(shí)現(xiàn)水書字符的定位與檢測(cè)的方法包括:
步驟3.1、將輸入圖片劃分為S*S個(gè)格子;
步驟3.2、每個(gè)格子預(yù)測(cè)出B個(gè)方框和它的置信度;
步驟3.3、每個(gè)方框包括五個(gè)預(yù)測(cè)值:x,y,w,h,和置信度,x,y代表方框中心相對(duì)于格子的坐標(biāo),w,h代表方框?qū)挾群透叨龋眯哦却眍A(yù)測(cè)方框和所有標(biāo)注方框的IOU;
步驟3.4、每個(gè)格子還要預(yù)測(cè)出C個(gè)條件概率Pr(Class i | Object),條件是基于格子包含物體的情況下,對(duì)于每個(gè)格子預(yù)測(cè)一組條件概率(C個(gè)),而不管B的數(shù)量;
步驟3.5、在檢測(cè)中,最后將類別的條件概率和每個(gè)方框的置信度相乘:
Pr(Classi|Object) ?Pr(Object) ? IOU = Pr(Classi) ? IOU
得出每個(gè)方框?qū)τ诿總€(gè)類別的置信度,這個(gè)分?jǐn)?shù)即包含了類別準(zhǔn)確性的概率也包含了預(yù)測(cè)框?qū)ξ矬w的符合程度。
本發(fā)明的有益效果:
本發(fā)明采用的卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種特殊的深層的神經(jīng)網(wǎng)絡(luò)模型,它是將BP和深度學(xué)習(xí)網(wǎng)絡(luò)相結(jié)合而產(chǎn)生的新型BP。卷積神經(jīng)網(wǎng)絡(luò)是為了識(shí)別二維形狀而設(shè)汁的多層感知器,具有局部感受,層次結(jié)構(gòu)、特征提取和分類過程結(jié)合的全局訓(xùn)練的特點(diǎn)。這種網(wǎng)絡(luò)結(jié)構(gòu)可對(duì)平移、旋轉(zhuǎn)、比例縮放、傾斜或者其他形式的變形具有高度不變性;CNN網(wǎng)絡(luò)利用了圖像的空間信息,增強(qiáng)了圖像中的特征,同時(shí),由于共用權(quán)值,大大減少了參數(shù)量,使得CNN結(jié)構(gòu)在訓(xùn)練時(shí)更能減少過擬合現(xiàn)象,提高了模型的泛化能力;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于貴州工業(yè)職業(yè)技術(shù)學(xué)院,未經(jīng)貴州工業(yè)職業(yè)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910217488.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 文字識(shí)別裝置、文字識(shí)別方法及文字識(shí)別程序
- 文字識(shí)別裝置、文字識(shí)別方法及文字識(shí)別程序
- 基于文字風(fēng)格識(shí)別的文字識(shí)別方法及裝置
- 證件文字的識(shí)別方法和裝置
- 扭曲文字的識(shí)別方法及裝置、存儲(chǔ)介質(zhì)及處理器
- 文字識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種文字識(shí)別方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種文字識(shí)別方法、系統(tǒng)及存儲(chǔ)介質(zhì)
- 文字識(shí)別方法及裝置、存儲(chǔ)介質(zhì)
- 基于CTC的圖像文字識(shí)別方法及裝置
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練的方法、裝置及電子設(shè)備
- 一種神經(jīng)網(wǎng)絡(luò)模型壓縮方法以及裝置
- 姿態(tài)檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于無標(biāo)簽數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)模型量化方法及裝置
- 神經(jīng)網(wǎng)絡(luò)模型更新方法、圖像處理方法及裝置
- 含有聚類拓?fù)漶詈系纳窠?jīng)網(wǎng)絡(luò)脈沖同步方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型的部署方法、設(shè)備及介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于框架搜索的深度神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法及系統(tǒng)
- 一種神經(jīng)網(wǎng)絡(luò)模型生成方法及裝置





