[發(fā)明專利]OCR識(shí)別準(zhǔn)確率的計(jì)算方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201911184085.2 | 申請(qǐng)日: | 2019-11-27 |
| 公開(公告)號(hào): | CN111144402A | 公開(公告)日: | 2020-05-12 |
| 發(fā)明(設(shè)計(jì))人: | 劉麗珍 | 申請(qǐng)(專利權(quán))人: | 深圳壹賬通智能科技有限公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/72 |
| 代理公司: | 深圳市精英專利事務(wù)所 44242 | 代理人: | 林燕云 |
| 地址: | 518000 廣東省深圳市前海深港合作區(qū)前*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | ocr 識(shí)別 準(zhǔn)確率 計(jì)算方法 裝置 設(shè)備 以及 存儲(chǔ) 介質(zhì) | ||
本發(fā)明實(shí)施例公開了一種OCR識(shí)別準(zhǔn)確率的計(jì)算方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì),通過(guò)獲取OCR識(shí)別結(jié)果中的文字信息,將OCR識(shí)別結(jié)果中的文字信息與原始文本中的正確文字信息進(jìn)行逐行匹配,根據(jù)匹配結(jié)果統(tǒng)計(jì)OCR識(shí)別結(jié)果中的文字信息中每行匹配失敗的文字?jǐn)?shù)量,根據(jù)正確文字信息的每行文字總數(shù)量與匹配失敗的文字?jǐn)?shù)量計(jì)算OCR識(shí)別結(jié)果中的文字信息中每行文字的OCR識(shí)別準(zhǔn)確率;根據(jù)每行文字的OCR識(shí)別準(zhǔn)確率計(jì)算所有行文字的OCR識(shí)別準(zhǔn)確率。本發(fā)明基于數(shù)據(jù)處理提供了一種OCR識(shí)別準(zhǔn)確率的計(jì)算方法,能夠高效率地完成OCR文檔識(shí)別的正確率的驗(yàn)證,可以提高OCR識(shí)別程序的性能以及識(shí)別率,同時(shí)也提高了測(cè)試的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,尤其涉及一種OCR識(shí)別準(zhǔn)確率的計(jì)算方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì)。
背景技術(shù)
目前,傳統(tǒng)的測(cè)試OCR(Optical Character Recognition,光學(xué)字符識(shí)別)識(shí)別準(zhǔn)確率的計(jì)算方法是,首先將待測(cè)試圖片傳遞給OCR識(shí)別程序,通過(guò)OCR識(shí)別程序?qū)⒆R(shí)別出來(lái)的文字經(jīng)過(guò)人工標(biāo)記,再將已標(biāo)記的文字與原文字進(jìn)行對(duì)比,最后再由人工統(tǒng)計(jì)對(duì)比結(jié)果,這種方式需要耗費(fèi)大量的時(shí)間,工作量比較繁瑣,而且測(cè)試效率低下。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明實(shí)施例提供一種OCR識(shí)別準(zhǔn)確率的計(jì)算方法、裝置、設(shè)備以及存儲(chǔ)介質(zhì),能夠高效率地完成OCR文檔識(shí)別的正確率的驗(yàn)證,可以提高OCR識(shí)別程序的性能以及識(shí)別率,同時(shí)也提高了測(cè)試的效率。
一方面,本發(fā)明實(shí)施例提供了一種OCR識(shí)別準(zhǔn)確率的計(jì)算方法,該方法包括:
獲取測(cè)試樣本的原始文本,所述原始文本包括正確文字信息;
將所述原始文本轉(zhuǎn)化為待測(cè)試圖像,并調(diào)用OCR(Optical CharacterRecognition,光學(xué)字符識(shí)別)識(shí)別接口對(duì)所述待測(cè)試圖像進(jìn)行OCR識(shí)別,得到OCR識(shí)別結(jié)果,所述OCR識(shí)別結(jié)果至少包括文字信息;
獲取所述原始文本的文本ID,通過(guò)所述文本ID查詢與所述原始文本相對(duì)應(yīng)的OCR識(shí)別結(jié)果中的文字信息,并逐行獲取所述OCR識(shí)別結(jié)果中的文字信息,將所獲取的OCR識(shí)別結(jié)果中的文字信息與所述原始文本中的正確文字信息進(jìn)行逐行匹配,根據(jù)匹配結(jié)果統(tǒng)計(jì)所述OCR識(shí)別結(jié)果中的文字信息中每行匹配失敗的文字?jǐn)?shù)量,根據(jù)所述正確文字信息的每行文字總數(shù)量與所述匹配失敗的文字?jǐn)?shù)量計(jì)算所述OCR識(shí)別結(jié)果中的文字信息中每行文字的OCR識(shí)別準(zhǔn)確率;
根據(jù)每行文字的OCR識(shí)別準(zhǔn)確率計(jì)算所有行文字的OCR識(shí)別準(zhǔn)確率。
另一方面,本發(fā)明實(shí)施例提供了一種OCR識(shí)別準(zhǔn)確率的計(jì)算裝置,所述裝置包括:
第一獲取單元,用于獲取測(cè)試樣本的原始文本,所述原始文本包括正確文字信息;
OCR識(shí)別單元,用于將所述原始文本轉(zhuǎn)化為待測(cè)試圖像,并調(diào)用OCR(OpticalCharacter Recognition,光學(xué)字符識(shí)別)識(shí)別接口對(duì)所述待測(cè)試圖像進(jìn)行OCR識(shí)別,得到OCR識(shí)別結(jié)果,所述OCR識(shí)別結(jié)果至少包括文字信息;
第一計(jì)算單元,用于獲取所述原始文本的文本ID,通過(guò)所述文本ID查詢與所述原始文本相對(duì)應(yīng)的OCR識(shí)別結(jié)果中的文字信息,并逐行獲取所述OCR識(shí)別結(jié)果中的文字信息,將所獲取的OCR識(shí)別結(jié)果中的文字信息與所述原始文本中的正確文字信息進(jìn)行逐行匹配,根據(jù)匹配結(jié)果統(tǒng)計(jì)所述OCR識(shí)別結(jié)果中的文字信息中每行匹配失敗的文字?jǐn)?shù)量,根據(jù)所述正確文字信息的每行文字總數(shù)量與所述匹配失敗的文字?jǐn)?shù)量計(jì)算所述OCR識(shí)別結(jié)果中的文字信息中每行文字的OCR識(shí)別準(zhǔn)確率;
第二計(jì)算單元,用于根據(jù)每行文字的OCR識(shí)別準(zhǔn)確率計(jì)算所有行文字的OCR識(shí)別準(zhǔn)確率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳壹賬通智能科技有限公司,未經(jīng)深圳壹賬通智能科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911184085.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- OCR文檔識(shí)別方法及其裝置
- 智能調(diào)度多OCR識(shí)別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學(xué)系統(tǒng)的OCR識(shí)別方法、裝置和終端
- OCR識(shí)別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測(cè)方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評(píng)估方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- OCR模型訓(xùn)練方法、系統(tǒng)及裝置
- 識(shí)別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- OCR訓(xùn)練數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 提高搜索準(zhǔn)確率的方法和裝置
- 改良對(duì)焦準(zhǔn)確率的鏡頭及其攝像裝置
- 測(cè)量數(shù)據(jù)處理準(zhǔn)確性方法和系統(tǒng)以及數(shù)據(jù)處理方法和系統(tǒng)
- 語(yǔ)音控制準(zhǔn)確率調(diào)整方法和系統(tǒng)
- 高準(zhǔn)確率的氣密檢測(cè)裝置
- 校正準(zhǔn)確率高的振動(dòng)盤
- 標(biāo)注準(zhǔn)確率評(píng)估方法及裝置
- 校正準(zhǔn)確率高的振動(dòng)盤
- 高準(zhǔn)確率激光測(cè)距儀
- 點(diǎn)鈔準(zhǔn)確率改進(jìn)的點(diǎn)鈔機(jī)
- 電網(wǎng)理論線損的計(jì)算方法和系統(tǒng)
- 一種基于XML的小衛(wèi)星遙測(cè)參數(shù)衍生計(jì)算方法
- 一種基于多尺度耦合的并行進(jìn)程合并方法及系統(tǒng)
- 一種注采井網(wǎng)流場(chǎng)速度的快速計(jì)算方法
- 一種自適應(yīng)實(shí)時(shí)火星系統(tǒng)星歷計(jì)算方法
- 基于分類模型的合同費(fèi)用計(jì)算方法、裝置及計(jì)算機(jī)設(shè)備
- 一種超越函數(shù)計(jì)算方法及裝置
- 計(jì)算方法決定系統(tǒng)、計(jì)算方法決定方法、記錄介質(zhì)
- 一種混合湍流計(jì)算方法
- 一種基于芯片檢測(cè)的HRD評(píng)分計(jì)算方法





