[發(fā)明專利]一種圖像識別的方法和裝置有效
申請?zhí)枺?/td> | 201910854215.2 | 申請日: | 2019-09-10 |
公開(公告)號: | CN110555431B | 公開(公告)日: | 2022-12-13 |
發(fā)明(設計)人: | 沈惠芬 | 申請(專利權(quán))人: | 杭州橙鷹數(shù)據(jù)技術(shù)有限公司 |
主分類號: | G06V10/22 | 分類號: | G06V10/22;G06V30/142 |
代理公司: | 北京智信禾專利代理有限公司 11637 | 代理人: | 劉曉楠 |
地址: | 310000 浙江省杭州市余杭*** | 國省代碼: | 浙江;33 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 圖像 識別 方法 裝置 | ||
本申請?zhí)峁┮环N圖像識別的方法和裝置,所述方法包括:根據(jù)輸入的圖像,生成所述圖像對應的符號集,劃分所述符號集獲取子符號集,所述子符號集包括至少一個符號塊;識別每個所述子符號集的類別,根據(jù)所述子符號集的類別調(diào)用識別模型;根據(jù)所述識別模型輸出的子符號集對應的符號,確定所述子符號集對應的目標符號;根據(jù)每個子符號集對應的目標符號,生成所述符號集對應的符號文本。通過對子符號集的類別進行判斷,調(diào)用子符號集中符號塊對應的識別模型,有針對性地增強子符號集中符號塊的檢測效果,提高子符號集中符號塊識別的準確性,給用戶編輯圖像對應的符號文本帶來了極大的便利。
技術(shù)領域
本申請涉及圖像處理技術(shù)領域,特別涉及一種圖像識別的方法和裝置、計算設備及計算機可讀存儲介質(zhì)。
背景技術(shù)
隨著移動終端的快速發(fā)展與普及,基于多媒體信息處理的需求越來越大,例如圖像OCR(Optical Character Recognition,光學字符識別)識別,首先對圖像中的字符塊進行提取,之后采用OCR識別將字符塊轉(zhuǎn)換為對應的文本。
現(xiàn)有技術(shù)中,圖像識別模型的訓練方法是根據(jù)所有要識別的字符內(nèi)容對模型進行訓練,會導致對部分類別的字符識別效果較差,上述識別模型對圖像進行識別,識別出來的文本的錯誤率較高,給用戶編輯圖像對應的文本帶來了麻煩。
發(fā)明內(nèi)容
有鑒于此,本申請實施例提供了一種圖像識別的方法和裝置、計算設備及計算機可讀存儲介質(zhì),以解決現(xiàn)有技術(shù)中存在的技術(shù)缺陷。
本申請實施例公開了一種圖像識別的方法,包括:根據(jù)輸入的圖像,生成所述圖像對應的符號集,劃分所述符號集獲取子符號集,所述子符號集包括至少一個符號塊;
識別每個所述子符號集的類別,根據(jù)所述子符號集的類別調(diào)用識別模型;
根據(jù)所述識別模型輸出的子符號集對應的符號,確定所述子符號集對應的目標符號;
根據(jù)每個子符號集對應的目標符號,生成所述符號集對應的符號文本。
本申請實施例還公開了一種圖像識別的裝置,包括:
處理模塊,被配置為根據(jù)輸入的圖像,生成所述圖像對應的符號集,劃分所述符號集獲取子符號集,所述子符號集包括至少一個符號塊;
調(diào)用模塊,被配置為識別每個所述子符號集的類別,根據(jù)所述子符號集的類別調(diào)用識別模型;
確定模塊,被配置為根據(jù)所述識別模型輸出的子符號集對應的符號,確定所述子符號集對應的目標符號;
生成模塊,被配置為根據(jù)每個子符號集對應的目標符號,生成所述符號集對應的符號文本。
本申請實施例公開了一種計算設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機指令,所述處理器執(zhí)行所述指令時實現(xiàn)如上所述的圖像識別的方法的步驟。
本申請實施例公開了一種計算機可讀存儲介質(zhì),其存儲有計算機指令,該指令被處理器執(zhí)行時實現(xiàn)如上所述的圖像識別的方法的步驟。
本申請?zhí)峁┑囊环N圖像識別的方法和裝置,通過對子符號集的類別進行判斷,即確定子符號集中符號塊所屬的類別,自適應選擇子符號集中符號塊對應的識別模型,有針對性地增強子符號集中符號塊的檢測效果,即便是出現(xiàn)不存在上下文關系的子符號集中符號塊的情況時,對子符號集中符號塊進行識別分類后調(diào)用對應的識別模型,能夠大幅提高子符號集中符號塊識別的準確性,進而提高對圖像識別獲取可編輯的符號文本的準確性,給用戶編輯圖像對應的符號文本帶來了極大的便利。
附圖說明
圖1是本申請實施例的計算設備的結(jié)構(gòu)示意圖;
圖2是本申請一實施例的圖像識別方法的流程示意圖;
圖3是本申請圖像識別的方法中獲取子符號集的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州橙鷹數(shù)據(jù)技術(shù)有限公司,未經(jīng)杭州橙鷹數(shù)據(jù)技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910854215.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序