[發(fā)明專利]一種快速標(biāo)注OCR錯(cuò)誤的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202310306782.0 | 申請(qǐng)日: | 2023-03-27 |
| 公開(公告)號(hào): | CN116206311A | 公開(公告)日: | 2023-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 王冠 | 申請(qǐng)(專利權(quán))人: | 可之(寧波)人工智能科技有限公司 |
| 主分類號(hào): | G06V30/10 | 分類號(hào): | G06V30/10;G06V10/764 |
| 代理公司: | 六安創(chuàng)新傲風(fēng)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 34258 | 代理人: | 龔鑫 |
| 地址: | 315000 浙江省寧波*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 快速 標(biāo)注 ocr 錯(cuò)誤 方法 | ||
本發(fā)明涉及教育技術(shù)領(lǐng)域,且公開了一種快速標(biāo)注OCR錯(cuò)誤的方法,包括以下步驟:1)、讀取小題數(shù)據(jù):讀取一個(gè)小題的OCR識(shí)別數(shù)據(jù);2)、小題數(shù)據(jù)排序:采用特定的方式對(duì)識(shí)別轉(zhuǎn)換的小題數(shù)據(jù)進(jìn)行特定的綜合排序;3)、顯示縮略圖:識(shí)別出的數(shù)據(jù)對(duì)應(yīng)特定的數(shù)據(jù)圖像,將排序后的數(shù)據(jù)對(duì)應(yīng)的圖像進(jìn)行壓縮處理,處理后的圖像進(jìn)行縮略圖顯示;4)、快速框選錯(cuò)誤:查看縮略圖找出ocr異常的數(shù)據(jù)并進(jìn)行選中;5)、導(dǎo)出數(shù)據(jù)。本發(fā)明通過讓同一個(gè)小題內(nèi)的數(shù)據(jù)進(jìn)行排序,然后使用縮略圖以觀察錯(cuò)誤數(shù)據(jù),這樣即可很快的找出有錯(cuò)誤的ocr數(shù)據(jù),并且進(jìn)行標(biāo)注,在對(duì)同一小題的識(shí)別數(shù)據(jù)進(jìn)行排序時(shí)可采用四種不同的排序方式,排序方式可選擇,整體排序準(zhǔn)確度提高。
技術(shù)領(lǐng)域
本發(fā)明涉及教育技術(shù)領(lǐng)域,尤其涉及一種快速標(biāo)注OCR錯(cuò)誤的方法。
背景技術(shù)
ocr識(shí)別錯(cuò)誤數(shù)據(jù)對(duì)后續(xù)的ocr修復(fù)、訓(xùn)練都有很大幫助。但是要很快找到ocr識(shí)別錯(cuò)誤的數(shù)據(jù)卻是比較麻煩的;
傳統(tǒng)的標(biāo)注方法是需要人工一個(gè)個(gè)依次標(biāo)注,比較緩慢,整體效率有待提高。
為此,我們提出一種快速標(biāo)注OCR錯(cuò)誤的方法。
發(fā)明內(nèi)容
本發(fā)明主要是解決上述現(xiàn)有技術(shù)所存在的技術(shù)問題,提供一種快速標(biāo)注OCR錯(cuò)誤的方法。
為了實(shí)現(xiàn)上述目的,本發(fā)明采用了如下技術(shù)方案,一種快速標(biāo)注OCR錯(cuò)誤的方法,包括以下步驟:
1)、讀取小題數(shù)據(jù):讀取一個(gè)小題的OCR識(shí)別數(shù)據(jù);
2)、小題數(shù)據(jù)排序:采用特定的方式對(duì)識(shí)別轉(zhuǎn)換的小題數(shù)據(jù)進(jìn)行特定的綜合排序;
3)、顯示縮略圖:識(shí)別出的數(shù)據(jù)對(duì)應(yīng)特定的數(shù)據(jù)圖像,將排序后的數(shù)據(jù)對(duì)應(yīng)的圖像進(jìn)行壓縮處理,處理后的圖像進(jìn)行縮略圖顯示;
4)、快速框選錯(cuò)誤:查看縮略圖找出ocr異常的數(shù)據(jù)并進(jìn)行選中;
5)、導(dǎo)出數(shù)據(jù)。
作為優(yōu)選,所述步驟一中在進(jìn)行識(shí)別時(shí),單次OCR識(shí)別僅限于同一小題內(nèi),識(shí)別后的字符轉(zhuǎn)換為計(jì)算機(jī)文字并進(jìn)行儲(chǔ)存。
作為優(yōu)選,所述步驟二中排序時(shí)僅限于同一小題內(nèi)數(shù)據(jù)進(jìn)行排序,排序方式有四種。
作為優(yōu)選,所述步驟2中的排序方式包括以下:a.按與答案接近的程度進(jìn)行排序;
b.按照機(jī)器批閱結(jié)果進(jìn)行排序;
c.按文字詞匯正確的程度進(jìn)行排序;
d.按文字的置信程度進(jìn)行排序。
作為優(yōu)選,所述步驟三中同一小題內(nèi)的所有數(shù)據(jù)圖片進(jìn)行經(jīng)過壓縮處理后的得到對(duì)應(yīng)的小圖,對(duì)應(yīng)的小圖即為縮略圖,縮略圖顯示可供相關(guān)人員一次察看多個(gè)數(shù)據(jù)照片。
作為優(yōu)選,所述步驟四中在對(duì)數(shù)據(jù)進(jìn)行數(shù)據(jù)框選時(shí)采用人工框選的方式。
有益效果
本發(fā)明提供了一種快速標(biāo)注OCR錯(cuò)誤的方法。具備以下有益效果:
(1)、該一種快速標(biāo)注OCR錯(cuò)誤的方法,讀取一個(gè)小題的OCR識(shí)別數(shù)據(jù),識(shí)別后的字符轉(zhuǎn)換為計(jì)算機(jī)文字并進(jìn)行儲(chǔ)存,然后采用特定的方式對(duì)識(shí)別轉(zhuǎn)換的小題數(shù)據(jù)進(jìn)行特定的綜合排序,排序時(shí)僅限于同一小題內(nèi)數(shù)據(jù)進(jìn)行排序,識(shí)別出的數(shù)據(jù)對(duì)應(yīng)特定的數(shù)據(jù)圖像,將排序后的數(shù)據(jù)對(duì)應(yīng)的圖像進(jìn)行壓縮處理,處理后的圖像進(jìn)行縮略圖顯示,同一小題內(nèi)的所有數(shù)據(jù)圖片進(jìn)行經(jīng)過壓縮處理后的得到對(duì)應(yīng)的小圖,人工觀察快速查看縮略圖找出ocr異常的數(shù)據(jù)進(jìn)行選中,在同一個(gè)小題內(nèi),考生的書寫內(nèi)容不會(huì)有太多可能的寫法,通過讓同一個(gè)小題內(nèi)的數(shù)據(jù)進(jìn)行排序,然后使用縮略圖以觀察錯(cuò)誤數(shù)據(jù),這樣即可很快的找出有錯(cuò)誤的ocr數(shù)據(jù),并且進(jìn)行標(biāo)注。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于可之(寧波)人工智能科技有限公司,未經(jīng)可之(寧波)人工智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310306782.0/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 標(biāo)注信息生成裝置、查詢裝置及共享系統(tǒng)
- 一種圖像分割標(biāo)注方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種數(shù)據(jù)標(biāo)注方法
- 一種基于群智的語料庫數(shù)據(jù)標(biāo)注方法及系統(tǒng)
- 一種圖像標(biāo)注方法和裝置
- 一種樣本標(biāo)注方法、裝置、存儲(chǔ)介質(zhì)及設(shè)備
- 數(shù)據(jù)標(biāo)注管理方法及裝置、電子設(shè)備和可讀存儲(chǔ)介質(zhì)
- 標(biāo)注的更新方法、裝置、存儲(chǔ)介質(zhì)、處理器以及運(yùn)載工具
- 數(shù)據(jù)的標(biāo)注方法和裝置
- 一種智能標(biāo)注平臺(tái)的方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- OCR文檔識(shí)別方法及其裝置
- 智能調(diào)度多OCR識(shí)別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學(xué)系統(tǒng)的OCR識(shí)別方法、裝置和終端
- OCR識(shí)別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測(cè)方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評(píng)估方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- OCR模型訓(xùn)練方法、系統(tǒng)及裝置
- 識(shí)別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- OCR訓(xùn)練數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)





