[發(fā)明專利]一種模型訓(xùn)練的方法以及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202110289276.6 | 申請(qǐng)日: | 2021-03-18 |
| 公開(kāi)(公告)號(hào): | CN113011428A | 公開(kāi)(公告)日: | 2021-06-22 |
| 發(fā)明(設(shè)計(jì))人: | 白翔;邱陽(yáng);張文慶;姜仟藝;宋祺;劉曦;張睿;魏曉林 | 申請(qǐng)(專利權(quán))人: | 北京三快在線科技有限公司;華中科技大學(xué) |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/32;G06K9/62 |
| 代理公司: | 北京曼威知識(shí)產(chǎn)權(quán)代理有限公司 11709 | 代理人: | 方志煒 |
| 地址: | 100080 北京市海*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 模型 訓(xùn)練 方法 以及 裝置 | ||
本說(shuō)明書公開(kāi)了一種模型訓(xùn)練的方法以及裝置,獲取各待標(biāo)注圖像,針對(duì)每個(gè)待標(biāo)注圖像,將該待標(biāo)注圖像輸入到待訓(xùn)練的文字行識(shí)別模型中,得到文字行識(shí)別結(jié)果,以及將該待標(biāo)注圖像輸入到預(yù)設(shè)的單字識(shí)別模型中,得到單字識(shí)別結(jié)果。而后,根據(jù)單字識(shí)別結(jié)果,對(duì)文字行識(shí)別結(jié)果進(jìn)行校正,得到校正后文字行識(shí)別結(jié)果。最后,根據(jù)校正后文字行識(shí)別結(jié)果,對(duì)該待標(biāo)注圖像進(jìn)行標(biāo)注,得到標(biāo)注后圖像,通過(guò)標(biāo)注后圖像,對(duì)待訓(xùn)練的文字行識(shí)別模型進(jìn)行模型訓(xùn)練。本方法將單字識(shí)別結(jié)果和文字行識(shí)別結(jié)果進(jìn)行結(jié)合,可以有效的提高數(shù)據(jù)標(biāo)注的準(zhǔn)確性,從而使得文字行識(shí)別模型的準(zhǔn)確率提高。
技術(shù)領(lǐng)域
本說(shuō)明書涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種模型訓(xùn)練的方法以及裝置。
背景技術(shù)
隨著電子技術(shù)和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,文字識(shí)別算法得到了巨大進(jìn)展。目前,訓(xùn)練一個(gè)高精度的文字識(shí)別模型需要大量精細(xì)的人工標(biāo)注數(shù)據(jù)作為監(jiān)督,而準(zhǔn)備一個(gè)滿足需求的標(biāo)注數(shù)據(jù)集對(duì)于時(shí)間成本和人力成本的耗費(fèi)十分巨大。
在現(xiàn)有技術(shù)中,將無(wú)標(biāo)注的數(shù)據(jù)輸入到兩個(gè)不同的文字識(shí)別模型中,輸出兩個(gè)識(shí)別結(jié)果,通過(guò)一個(gè)判別器將其中一個(gè)識(shí)別結(jié)果作為數(shù)據(jù)標(biāo)注,再使用標(biāo)注后的數(shù)據(jù)對(duì)文字識(shí)別模型進(jìn)行訓(xùn)練,而判別器無(wú)法準(zhǔn)確的選擇出正確的識(shí)別結(jié)果,所以,當(dāng)這兩個(gè)文字識(shí)別模型輸出的識(shí)別結(jié)果存在錯(cuò)誤的情況下,將導(dǎo)致數(shù)據(jù)的標(biāo)注出現(xiàn)錯(cuò)誤,從而使得文字識(shí)別模型的準(zhǔn)確率降低。
因此,如何提高對(duì)數(shù)據(jù)標(biāo)注的準(zhǔn)確性,從而使得文字識(shí)別模型的準(zhǔn)確率提高,則是一個(gè)亟待解決的問(wèn)題。
發(fā)明內(nèi)容
本說(shuō)明書提供一種模型訓(xùn)練的方法、裝置、存儲(chǔ)介質(zhì)及電子設(shè)備,以部分的解決現(xiàn)有技術(shù)存在的上述問(wèn)題。
本說(shuō)明書采用下述技術(shù)方案:
本說(shuō)明書提供了一種模型訓(xùn)練的方法,包括:
獲取各待標(biāo)注圖像;
針對(duì)每個(gè)待標(biāo)注圖像,將該待標(biāo)注圖像輸入到待訓(xùn)練的文字行識(shí)別模型中,得到文字行識(shí)別結(jié)果,以及將該待標(biāo)注圖像輸入到預(yù)設(shè)的單字識(shí)別模型中,得到單字識(shí)別結(jié)果;
根據(jù)所述單字識(shí)別結(jié)果,對(duì)所述文字行識(shí)別結(jié)果進(jìn)行校正,得到校正后文字行識(shí)別結(jié)果;
根據(jù)所述校正后文字行識(shí)別結(jié)果,對(duì)該待標(biāo)注圖像進(jìn)行標(biāo)注,得到標(biāo)注后圖像;
通過(guò)所述標(biāo)注后圖像,對(duì)所述待訓(xùn)練的文字行識(shí)別模型進(jìn)行模型訓(xùn)練。
可選地,將該待標(biāo)注圖像輸入到待訓(xùn)練的文字行識(shí)別模型中,得到文字行識(shí)別結(jié)果,具體包括:
將該待標(biāo)注圖像輸入到待訓(xùn)練的文字行識(shí)別模型中,得到所述文字行識(shí)別模型識(shí)別出的該待標(biāo)注圖像中所包含的文字行信息,以及所述文字行信息在該待標(biāo)注圖像中的文字行位置;
將所述文字行位置以及所述文字行信息,作為所述文字行識(shí)別結(jié)果;
將該待標(biāo)注圖像輸入到預(yù)設(shè)的單字識(shí)別模型中,得到單字識(shí)別結(jié)果,具體包括:
將該待標(biāo)注圖像輸入到所述單字識(shí)別模型中,得到所述單字識(shí)別模型識(shí)別出的該待標(biāo)注圖像中所包含的各單字信息,以及每個(gè)單字信息在該待標(biāo)注圖像中的單字位置;
將所述各單字信息以及每個(gè)單字信息在該待標(biāo)注圖像中的單字位置,作為所述單字識(shí)別結(jié)果。
可選地,根據(jù)所述單字識(shí)別結(jié)果,對(duì)所述文字行識(shí)別結(jié)果進(jìn)行校正之前,所述方法還包括:
針對(duì)所述單字識(shí)別結(jié)果中的每個(gè)單字信息,根據(jù)確定出的該單字信息在該待標(biāo)注圖像中的單字位置以及所述文字行位置,確定該單字信息與所述文字行信息在該待標(biāo)注圖像中的區(qū)域重合度;
若確定所述區(qū)域重合度不小于設(shè)定重合度,確定該單字信息歸屬于所述文字行信息;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京三快在線科技有限公司;華中科技大學(xué),未經(jīng)北京三快在線科技有限公司;華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110289276.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:一種非接觸三維成像測(cè)量方法、系統(tǒng)及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 下一篇:基于GIC監(jiān)測(cè)裝置的變壓器無(wú)功擾動(dòng)計(jì)算方法
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 等級(jí)精細(xì)視力訓(xùn)練表
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 視覺(jué)盲點(diǎn)演示與旁中心注視訓(xùn)練儀
- 一種訓(xùn)練室
- 康復(fù)訓(xùn)練器及其定量訓(xùn)練方法和定量訓(xùn)練裝置
- 一種分布式訓(xùn)練中梯度同步方法及裝置
- 訓(xùn)練模型的訓(xùn)練時(shí)長(zhǎng)預(yù)測(cè)方法及裝置
- 一種模型訓(xùn)練方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種計(jì)算機(jī)輔助的自閉癥兒童情感社交康復(fù)訓(xùn)練系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 接收裝置以及接收方法、以及程序
- 凈水濾芯以及凈水裝置、以及洗漱臺(tái)
- 隱匿檢索系統(tǒng)以及公開(kāi)參數(shù)生成裝置以及加密裝置以及用戶秘密密鑰生成裝置以及查詢發(fā)布裝置以及檢索裝置以及計(jì)算機(jī)程序以及隱匿檢索方法以及公開(kāi)參數(shù)生成方法以及加密方法以及用戶秘密密鑰生成方法以及查詢發(fā)布方法以及檢索方法
- 編碼方法以及裝置、解碼方法以及裝置
- 編碼方法以及裝置、解碼方法以及裝置
- 圖片顯示方法以及裝置以及移動(dòng)終端
- ENB以及UEUL發(fā)送以及接收的方法
- X射線探測(cè)方法以及裝置以及系統(tǒng)
- 圖書信息錄入方法以及系統(tǒng)以及書架
- 護(hù)耳器以及口罩以及眼鏡





