[發(fā)明專利]用于字符識別的方法、系統(tǒng)和非瞬時計算機可讀介質(zhì)有效
| 申請?zhí)枺?/td> | 201810161029.6 | 申請日: | 2018-02-27 |
| 公開(公告)號: | CN108509955B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計)人: | 斯圖爾特.瓜爾涅里;詹森.詹姆斯.格拉姆斯 | 申請(專利權(quán))人: | 柯尼卡美能達(dá)美國研究所有限公司 |
| 主分類號: | G06V30/10 | 分類號: | G06V30/10;G06V10/54 |
| 代理公司: | 北京市柳沈律師事務(wù)所 11105 | 代理人: | 李芳華 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 字符 識別 方法 系統(tǒng) 瞬時 計算機 可讀 介質(zhì) | ||
一種用于字符識別的方法。該方法包括:獲得從圖像提取的多個字符片段;確定具有所述多個字符片段的第一集合的第一字符邊界框以及具有所述多個字符片段的第二集合的第二字符邊界框;確定用于該第一集合的多個方向和用于該第一集合的多個定時屬性,其中所述多個定時屬性包括用于該第一集合的排序和用于該第一集合的繪制持續(xù)時間;和通過向智能字符識別(ICR)引擎發(fā)送該第一集合、用于該第一集合的多個方向、和用于該第一集合的多個定時屬性,而運行用于該第一字符邊界框的字符識別。
技術(shù)領(lǐng)域
本發(fā)明涉及字符識別,并更具體地,涉及用于字符識別的方法、系統(tǒng)和非瞬時計算機可讀介質(zhì)。
背景技術(shù)
可通過掃描硬拷貝文檔而生成圖像。也可通過將電子文檔(例如,字處理文檔、幻燈片放映的幻燈片、電子表格、網(wǎng)頁等)變換為圖像格式(例如,位圖)的軟件應(yīng)用,而生成圖像。因此,圖像通常包括多個手繪文本字符,而不管如何生成該圖像。在具有文本字符的圖像被恢復(fù)用于觀看、打印、分析等之前,可存儲(即,存檔(archived))該圖像達(dá)到相當(dāng)長時間。
智能字符識別(ICR)是這樣的技術(shù),其標(biāo)識(即,識別)圖像中的文本字符,并輸出這些文本字符的電子可編輯版本(例如,串)。可在手繪文本字符的同時執(zhí)行ICR,并由此ICR能利用定時信息來正確識別這些字符。然而,如果在繪制文本字符之后執(zhí)行ICR(例如,對存檔的圖像執(zhí)行ICR),則定時信息不可用,并且ICR的性能受損。無論如何,用戶仍然希望對具有手繪字符的存檔的圖像執(zhí)行ICR。
發(fā)明內(nèi)容
一般來說,在一個方面,本發(fā)明的實施例涉及一種用于字符識別的方法。該方法包括:獲得從圖像提取的多個字符片段;確定包括所述多個字符片段的第一集合的第一字符邊界框(bounding boxes)以及包括所述多個字符片段的第二集合的第二字符邊界框;確定用于該第一集合的多個方向和用于該第一集合的多個定時屬性,其中所述多個定時屬性包括用于第一集合的排序和用于該第一集合的繪制持續(xù)時間;和通過向智能字符識別(ICR)引擎發(fā)送該第一集合、用于該第一集合的多個方向、和用于該第一集合的多個定時屬性,而運行用于該第一字符邊界框的字符識別。
一般來說,在一個方面,本發(fā)明的實施例涉及一種用于字符識別的系統(tǒng)。該系統(tǒng)包括:存儲器;計算機處理器,與該存儲器連接,并且用于:獲得從圖像提取的多個字符片段;確定包括所述多個字符片段的第一集合的第一字符邊界框以及包括所述多個字符片段的第二集合的第二字符邊界框;確定用于該第一集合的多個方向和用于該第一集合的多個定時屬性,其中所述多個定時屬性包括用于該第一集合的排序和用于該第一集合的繪制持續(xù)時間;和通過向智能字符識別(ICR)引擎發(fā)送該第一集合、用于該第一集合的多個方向、和用于該第一集合的多個定時屬性,而運行用于該第一字符邊界框的字符識別。
一般來說,在一個方面,本發(fā)明的實施例涉及一種存儲有計算機程序代碼的非瞬時計算機可讀介質(zhì)(CRM)。所述計算機程序代碼當(dāng)由計算機處理器運行時,用于:獲得從圖像提取的多個字符片段;確定包括所述多個字符片段的第一集合的第一字符邊界框以及包括所述多個字符片段的第二集合的第二字符邊界框;確定用于該第一集合的多個方向和用于該第一集合的多個定時屬性,其中所述多個定時屬性包括用于該第一集合的排序和用于該第一集合的繪制持續(xù)時間;和通過向智能字符識別(ICR)引擎發(fā)送該第一集合、用于該第一集合的多個方向、和用于該第一集合的多個定時屬性,而運行用于該第一字符邊界框的字符識別。
一般來說,在一個方面,本發(fā)明的實施例涉及一種用于字符識別的方法。該方法包括:獲得從圖像提取的多個字符片段;確定包括所述多個字符片段的第一集合的第一字符邊界框以及包括所述多個字符片段的第二集合的第二字符邊界框;基于用于該第一集合的多個紋理屬性,來確定用于該第一集合的排序;基于用于該第一集合的多個刷子寬度和多個密度,來確定該第一集合的多個方向;和通過向智能字符識別(ICR)引擎發(fā)送該第一集合、該第一集合的多個方向、和用于該第一集合的排序,而運行用于該第一字符邊界框的字符識別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于柯尼卡美能達(dá)美國研究所有限公司,未經(jīng)柯尼卡美能達(dá)美國研究所有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810161029.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





