[發(fā)明專利]基于神經(jīng)網(wǎng)絡(luò)模型的手寫識(shí)別方法、裝置及電子設(shè)備在審
| 申請(qǐng)?zhí)枺?/td> | 201911143048.7 | 申請(qǐng)日: | 2019-11-20 |
| 公開(公告)號(hào): | CN110942004A | 公開(公告)日: | 2020-03-31 |
| 發(fā)明(設(shè)計(jì))人: | 劉俊仕 | 申請(qǐng)(專利權(quán))人: | 深圳追一科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市智圈知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44351 | 代理人: | 苗燕 |
| 地址: | 518057 廣東省深圳市南山區(qū)粵海街道*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 神經(jīng)網(wǎng)絡(luò) 模型 手寫 識(shí)別 方法 裝置 電子設(shè)備 | ||
本申請(qǐng)實(shí)施例公開了一種基于神經(jīng)網(wǎng)絡(luò)模型的手寫識(shí)別方法、裝置及電子設(shè)備,涉及圖像識(shí)別技術(shù)領(lǐng)域。神經(jīng)網(wǎng)絡(luò)模型包括第一神經(jīng)網(wǎng)絡(luò)、第二神經(jīng)網(wǎng)絡(luò),該方法包括:對(duì)待識(shí)別圖像進(jìn)行預(yù)處理,得到至少一個(gè)文本行,待識(shí)別圖像包括手寫字體;將文本行輸入第一神經(jīng)網(wǎng)絡(luò),以獲得至少一個(gè)分割后的字符;將至少一個(gè)分割后的字符輸入第二神經(jīng)網(wǎng)絡(luò),以輸出識(shí)別手寫字體后對(duì)應(yīng)的文本。本申請(qǐng)實(shí)施例通過兩個(gè)神經(jīng)網(wǎng)絡(luò)分別對(duì)手寫字體進(jìn)行分割、對(duì)分割后的字符進(jìn)行識(shí)別,使得對(duì)分割結(jié)果和識(shí)別結(jié)果可實(shí)現(xiàn)較好的控制,以提高分割、識(shí)別準(zhǔn)確率,以及網(wǎng)絡(luò)訓(xùn)練效率。
技術(shù)領(lǐng)域
本申請(qǐng)實(shí)施例涉及圖像識(shí)別技術(shù)領(lǐng)域,更具體地,涉及一種基于神經(jīng)網(wǎng)絡(luò)模型的手寫識(shí)別方法、裝置及電子設(shè)備。
背景技術(shù)
中文手寫識(shí)別一直在拍照文檔、支票、表單表格、證件、郵政信封、票據(jù)、手稿文書等地方有重要的應(yīng)用。現(xiàn)有的手寫漢字識(shí)別框架大都基于傳統(tǒng)的預(yù)處理、特征提取、分類器,隨著深度學(xué)習(xí)的興起,基于深度學(xué)習(xí)的手寫識(shí)別方法所可以取得的效果普遍領(lǐng)先于傳統(tǒng)方法,但是在對(duì)連續(xù)的手寫漢字進(jìn)行識(shí)別時(shí),識(shí)別準(zhǔn)確率仍較低。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供一種基于神經(jīng)網(wǎng)絡(luò)模型的手寫識(shí)別方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì),以改善上述缺陷。
第一方面,本申請(qǐng)實(shí)施例提供了一種基于神經(jīng)網(wǎng)絡(luò)模型的手寫識(shí)別方法,所述神經(jīng)網(wǎng)絡(luò)模型包括第一神經(jīng)網(wǎng)絡(luò)、第二神經(jīng)網(wǎng)絡(luò),所述方法包括:對(duì)所述待識(shí)別圖像進(jìn)行預(yù)處理,得到至少一個(gè)文本行,所述待識(shí)別圖像包括手寫字體;將所述文本行輸入所述第一神經(jīng)網(wǎng)絡(luò),以獲得至少一個(gè)分割后的字符;將所述至少一個(gè)分割后的字符輸入所述第二神經(jīng)網(wǎng)絡(luò),以輸出識(shí)別所述手寫字體后對(duì)應(yīng)的文本。
可選地,所述將所述文本行輸入所述第一神經(jīng)網(wǎng)絡(luò),以獲得至少一個(gè)分割后的字符,包括:將所述文本行輸入第一神經(jīng)網(wǎng)絡(luò),獲得至少一個(gè)字符的估計(jì)位置信息及所述估計(jì)位置信息對(duì)應(yīng)的分割標(biāo)簽,所述分割標(biāo)簽包括可分割標(biāo)簽;根據(jù)所述可分割標(biāo)簽確定可分割位置;根據(jù)所述可分割位置對(duì)所述文本行區(qū)域進(jìn)行字符分割,獲得至少一個(gè)分割后的字符。
可選地,所述將所述至少一個(gè)分割后的字符輸入所述第二神經(jīng)網(wǎng)絡(luò),以輸出識(shí)別所述手寫字體后的文本之后,包括:獲取用戶基于所述輸出識(shí)別所述手寫字體后的文本的評(píng)價(jià)結(jié)果,所述評(píng)價(jià)結(jié)果包括錯(cuò)誤字符及所述錯(cuò)誤字符對(duì)應(yīng)的正確字符、正確位置信息;將所述正確位置信息作為真實(shí)位置信息,獲取所述錯(cuò)誤字符對(duì)應(yīng)的第一損失函數(shù)值,所述第一損失函數(shù)值與所述第一神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng),用于衡量所述錯(cuò)誤字符對(duì)應(yīng)的所述第一神經(jīng)網(wǎng)絡(luò)的輸出與所述錯(cuò)誤字符對(duì)應(yīng)的真實(shí)位置信息的誤差;將所述正確字符作為真實(shí)字符,獲取所述錯(cuò)誤字符對(duì)應(yīng)的第二損失函數(shù)值,所述第二損失函數(shù)值與所述第二神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng),用于衡量所述錯(cuò)誤字符對(duì)應(yīng)的所述第二神經(jīng)網(wǎng)絡(luò)的輸出與所處錯(cuò)誤字符對(duì)應(yīng)的真實(shí)字符之間的誤差;將所述第一損失函數(shù)值、所述第二損失函數(shù)值分別與預(yù)設(shè)閾值進(jìn)行比較,并將超過預(yù)設(shè)閾值的損失函數(shù)值確定為目標(biāo)損失函數(shù)值,將所述目標(biāo)損失函數(shù)值對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)確定為目標(biāo)神經(jīng)網(wǎng)絡(luò);基于所述目標(biāo)損失函數(shù)值,調(diào)整所述目標(biāo)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),并將調(diào)整后的目標(biāo)神經(jīng)網(wǎng)絡(luò)用于下一次手寫識(shí)別。
可選地,所述將所述第一損失函數(shù)值、所述第二損失函數(shù)值分別與預(yù)設(shè)閾值進(jìn)行比較,并將超過預(yù)設(shè)閾值的損失函數(shù)值確定為目標(biāo)損失函數(shù)值,將所述目標(biāo)損失函數(shù)值對(duì)應(yīng)的神經(jīng)網(wǎng)絡(luò)確定為目標(biāo)神經(jīng)網(wǎng)絡(luò),包括:若所述第一損失函數(shù)值超過預(yù)設(shè)閾值,將所述第一損失函數(shù)值確定為目標(biāo)損失函數(shù)值,將所述第一神經(jīng)網(wǎng)絡(luò)確定為目標(biāo)神經(jīng)網(wǎng)絡(luò),以用于調(diào)整所述第一損失函數(shù)值對(duì)應(yīng)的第一神經(jīng)網(wǎng)絡(luò);若所述第二損失函數(shù)值超過預(yù)設(shè)閾值,將所述第二損失函數(shù)值確定為目標(biāo)損失函數(shù)值,將所述第二神經(jīng)網(wǎng)絡(luò)確定為目標(biāo)神經(jīng)網(wǎng)絡(luò),以用于調(diào)整所述第二損失函數(shù)值對(duì)應(yīng)的第二神經(jīng)網(wǎng)絡(luò)。
可選地,獲取訓(xùn)練樣本集合,包括:采集樣本視覺模型驅(qū)動(dòng)參數(shù)以及樣本音頻信息;根據(jù)樣本視覺模型驅(qū)動(dòng)參數(shù)的時(shí)間戳信息以及樣本音頻信息的時(shí)間戳信息,對(duì)樣本視覺模型驅(qū)動(dòng)參數(shù)與樣本音頻信息進(jìn)行對(duì)齊。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳追一科技有限公司,未經(jīng)深圳追一科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911143048.7/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 硬件神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法、計(jì)算裝置、軟硬件協(xié)作系統(tǒng)
- 生成較大神經(jīng)網(wǎng)絡(luò)
- 神經(jīng)網(wǎng)絡(luò)的生成方法、生成裝置和電子設(shè)備
- 一種舌診方法、裝置、計(jì)算設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
- 脈沖神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換方法及相關(guān)轉(zhuǎn)換芯片
- 圖像處理方法、裝置、可讀存儲(chǔ)介質(zhì)和計(jì)算機(jī)設(shè)備
- 一種適應(yīng)目標(biāo)數(shù)據(jù)集的網(wǎng)絡(luò)模型微調(diào)方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 用于重構(gòu)人工神經(jīng)網(wǎng)絡(luò)的處理器及其操作方法、電氣設(shè)備
- 一種圖像神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化方法及裝置
- 一種能光學(xué)表現(xiàn)平面手寫面上書寫信息的工具
- 通過使用手寫數(shù)據(jù)再現(xiàn)手寫消息的裝置和方法
- 一種手寫筆跡電子化方法和系統(tǒng)
- 一種發(fā)送手書消息和再現(xiàn)手書消息的方法
- 一種新型無線手寫板
- 一種手寫能力量化評(píng)估系統(tǒng)及方法
- 手寫內(nèi)容去除方法、手寫內(nèi)容去除裝置、存儲(chǔ)介質(zhì)
- 文本圖像中手寫內(nèi)容去除方法、裝置、存儲(chǔ)介質(zhì)
- 一種手寫識(shí)別方法、裝置、電子設(shè)備及介質(zhì)
- 第三方手寫軟件快速手寫的實(shí)現(xiàn)方法、電子設(shè)備及存儲(chǔ)介質(zhì)





