[發(fā)明專(zhuān)利]基于圖像的文本識(shí)別方法、裝置及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202010076369.6 | 申請(qǐng)日: | 2020-01-22 |
| 公開(kāi)(公告)號(hào): | CN111291753A | 公開(kāi)(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 何嘉欣;劉鵬;劉玉宇;肖京 | 申請(qǐng)(專(zhuān)利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類(lèi)號(hào): | G06K9/32 | 分類(lèi)號(hào): | G06K9/32;G06K9/36;G06K9/62 |
| 代理公司: | 深圳市沃德知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 圖像 文本 識(shí)別 方法 裝置 存儲(chǔ) 介質(zhì) | ||
本發(fā)明涉及圖像處理領(lǐng)域,揭露了一種基于圖像的文本識(shí)別方法,該方法包括:接收用戶(hù)發(fā)出的攜帶待識(shí)別圖像的文本識(shí)別指令;將所述待識(shí)別圖像輸入預(yù)設(shè)識(shí)別模型中,得到第一識(shí)別結(jié)果;判斷所述第一識(shí)別結(jié)果是否滿(mǎn)足第一預(yù)設(shè)條件;若否,對(duì)所述第一文本框進(jìn)行多次變換,得到每個(gè)所述第一文本框?qū)?yīng)的多個(gè)第二文本框;將所述第一文本框?qū)?yīng)的多個(gè)第二文本框輸入所述識(shí)別模型中,得到所述第一文本框?qū)?yīng)的多個(gè)第二識(shí)別結(jié)果;判斷是否存在滿(mǎn)足第二預(yù)設(shè)條件的第二識(shí)別結(jié)果;若是,基于所述滿(mǎn)足第二預(yù)設(shè)條件的第二識(shí)別結(jié)果生成目標(biāo)識(shí)別結(jié)果,并反饋至所述用戶(hù)。本發(fā)明還揭露了一種電子裝置及計(jì)算機(jī)存儲(chǔ)介質(zhì)。利用本發(fā)明,可提高文本識(shí)別的準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識(shí)別領(lǐng)域,尤其涉及一種基于圖像的文本識(shí)別方法、電子裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。
背景技術(shù)
現(xiàn)今專(zhuān)用OCR識(shí)別已經(jīng)有一套成熟的算法,分別承擔(dān)目標(biāo)文件檢測(cè),字段檢測(cè)和字段識(shí)別,這個(gè)過(guò)程是端到端的,結(jié)果將直接輸出至用戶(hù)。
現(xiàn)有的通用OCR識(shí)別的基本流程是,首先檢測(cè)圖片中文字所在的區(qū)域,畫(huà)出每個(gè)區(qū)域的外接矩形框,然后把每個(gè)矩形框進(jìn)行基本的二維旋轉(zhuǎn)矯正后,把切塊輸入識(shí)別模塊,由此獲得整張圖片的全部文本內(nèi)容。雖然這個(gè)流程可以矯正目標(biāo)在二維平面內(nèi)的傾斜,然而,在實(shí)際的圖像識(shí)別情景中,經(jīng)常有識(shí)別對(duì)象和原圖片并不共平面的情況。這種情況下的圖像識(shí)別結(jié)果也會(huì)與正確的結(jié)果相差甚遠(yuǎn)。
因此,亟待提供一種能準(zhǔn)確從圖片中識(shí)別文本的方法。
發(fā)明內(nèi)容
鑒于以上內(nèi)容,本發(fā)明提供一種基于圖像的文本識(shí)別方法、電子裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其主要目的在于提高從圖像中識(shí)別文本的準(zhǔn)確性。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于圖像的文本識(shí)別方法,該方法包括:
接收步驟:接收用戶(hù)發(fā)出的文本識(shí)別指令,所述文本識(shí)別指令中包括待識(shí)別圖像;
第一識(shí)別步驟:將所述待識(shí)別圖像輸入預(yù)設(shè)識(shí)別模型中,得到第一識(shí)別結(jié)果,包括多個(gè)第一文本框;
第一判斷步驟:判斷所述第一識(shí)別結(jié)果是否滿(mǎn)足第一預(yù)設(shè)條件;
變換步驟:當(dāng)判斷所述第一識(shí)別結(jié)果不滿(mǎn)足所述第一預(yù)設(shè)條件時(shí),基于預(yù)設(shè)變換算法對(duì)所述第一文本框進(jìn)行多次變換,得到每個(gè)所述第一文本框?qū)?yīng)的多個(gè)第二文本框;
第二識(shí)別步驟:將所述第一文本框?qū)?yīng)的多個(gè)第二文本框輸入所述識(shí)別模型中,得到所述第一文本框?qū)?yīng)的多個(gè)第二識(shí)別結(jié)果;
第二判斷步驟:判斷所述第一文本框?qū)?yīng)的多個(gè)第二識(shí)別結(jié)果中是否存在滿(mǎn)足第二預(yù)設(shè)條件的第二識(shí)別結(jié)果;及
第一生成步驟,當(dāng)判斷存在滿(mǎn)足所述第二預(yù)設(shè)條件的第二識(shí)別結(jié)果時(shí),基于所述滿(mǎn)足第二預(yù)設(shè)條件的第二識(shí)別結(jié)果確定所述第一文本框?qū)?yīng)的目標(biāo)文本信息,生成目標(biāo)識(shí)別結(jié)果,并向所述用戶(hù)展示所述目標(biāo)識(shí)別結(jié)果。
此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種電子裝置,該裝置包括:存儲(chǔ)器、處理器,所述存儲(chǔ)器中存儲(chǔ)有可在所述處理器上運(yùn)行的基于圖像的文本識(shí)別程序,所述基于圖像的文本識(shí)別程序被所述處理器執(zhí)行時(shí)可實(shí)現(xiàn)如上所述基于圖像的文本識(shí)別方法中的任意步驟。
此外,為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中包括基于圖像的文本識(shí)別程序,所述基于圖像的文本識(shí)別程序被處理器執(zhí)行時(shí),可實(shí)現(xiàn)如上所述基于圖像的文本識(shí)別方法中的任意步驟。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010076369.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





