[發(fā)明專利]用于識別文字的方法和裝置有效
| 申請?zhí)枺?/td> | 202010097553.9 | 申請日: | 2020-02-17 |
| 公開(公告)號: | CN111291761B | 公開(公告)日: | 2023-08-04 |
| 發(fā)明(設(shè)計)人: | 馮博豪;陳興波;張小帥 | 申請(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V30/148;G06V30/18;G06V30/19 |
| 代理公司: | 北京英賽嘉華知識產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 用于 識別 文字 方法 裝置 | ||
本公開的實(shí)施例公開了用于識別文字的方法和裝置。該方法的一具體實(shí)施方式包括:獲取目標(biāo)區(qū)域的圖像,目標(biāo)區(qū)域為表面上存在凹凸結(jié)構(gòu)且凹凸結(jié)構(gòu)形成待識別文字的區(qū)域,圖像為采用平行光以預(yù)設(shè)角度照射于目標(biāo)區(qū)域時所采集的圖像;將圖像輸入預(yù)訓(xùn)練的目標(biāo)特征提取模型,獲得對應(yīng)圖像中的待識別文字的特征信息;將對應(yīng)圖像中的待識別文字的特征信息輸入預(yù)訓(xùn)練的目標(biāo)文字識別模型,獲得對應(yīng)圖像的目標(biāo)識別結(jié)果;基于對應(yīng)圖像的目標(biāo)識別結(jié)果,確定圖像中的文字。基于平行光以預(yù)設(shè)角度照射于目標(biāo)區(qū)域時所采集的圖像對待識別文字進(jìn)行識別,并基于對應(yīng)圖像的識別結(jié)果確定圖像中的文字,實(shí)現(xiàn)了對凹凸結(jié)構(gòu)形成的文字的自動識別,可以提高這類文字的識別效率。
技術(shù)領(lǐng)域
本公開的實(shí)施例涉及計算機(jī)技術(shù)領(lǐng)域,具體涉及圖像識別技術(shù)領(lǐng)域,尤其涉及用于識別文字的和裝置。
背景技術(shù)
在日常生活中,很多物體表面存在由凹凸結(jié)構(gòu)形成的文字,比如獎牌上面的文字,機(jī)械手表上面的刻度,圓形石頭上面的浮雕,以及輪胎上面的標(biāo)識。以輪胎上的標(biāo)識為例,這類文字記載了輪胎在制造過程中的關(guān)鍵信息,例如在輪胎側(cè)面記錄了輪胎的大部分重要信息,包括生產(chǎn)日期、硫化機(jī)臺號、輪胎型號及輪胎品牌等,翻新、跟蹤輪胎的使用時都需要提取這些關(guān)鍵信息。
但是現(xiàn)階段,尚沒有針對凹凸結(jié)構(gòu)形成的文字的智能識別技術(shù),只能由人工錄入。當(dāng)凹凸結(jié)構(gòu)形成的文字較多時,手工錄入的方式難以保證準(zhǔn)確率,而且錄入效率低。
發(fā)明內(nèi)容
本公開的實(shí)施例提出了用于識別文字的方法和裝置。
第一方面,本公開的實(shí)施例提供了一種用于識別文字的方法,該方法包括:獲取目標(biāo)區(qū)域的圖像,目標(biāo)區(qū)域為表面上存在凹凸結(jié)構(gòu)且凹凸結(jié)構(gòu)形成待識別文字的區(qū)域,圖像為采用平行光以預(yù)設(shè)角度照射于目標(biāo)區(qū)域時所采集的圖像;將圖像輸入預(yù)訓(xùn)練的目標(biāo)特征提取模型,獲得對應(yīng)圖像中的待識別文字的特征信息;將對應(yīng)圖像中的待識別文字的特征信息輸入預(yù)訓(xùn)練的目標(biāo)文字識別模型,獲得對應(yīng)圖像的目標(biāo)識別結(jié)果;基于對應(yīng)圖像的目標(biāo)識別結(jié)果,確定圖像中的文字。
在一些實(shí)施例中,獲取目標(biāo)區(qū)域的圖像,包括:分別獲取平行光以不同的預(yù)設(shè)角度照射于目標(biāo)區(qū)域所形成的圖像。
在一些實(shí)施例中,基于對應(yīng)圖像的目標(biāo)識別結(jié)果,確定圖像中的文字,包括:基于對應(yīng)圖像的目標(biāo)識別結(jié)果中重復(fù)率最高的目標(biāo)識別結(jié)果,確定圖像中的文字。
在一些實(shí)施例中,將圖像輸入預(yù)訓(xùn)練的目標(biāo)特征提取模型,獲得對應(yīng)圖像中的待識別文字的特征信息,包括:將圖像輸入目標(biāo)特征提取模型中的特征提取網(wǎng)絡(luò),獲得圖像中每個像素點(diǎn)的特征值,特征值用于表征該像素點(diǎn)是否存在待識別文字;以及在目標(biāo)特征提取模型中,執(zhí)行以下操作:基于特征值,確定待識別文字在圖像中的位置;基于待識別文字在圖像中的位置,對圖像進(jìn)行實(shí)例分割,得到實(shí)例分割圖和實(shí)例分割參數(shù),實(shí)例分割參數(shù)用于表征對應(yīng)的實(shí)例分割圖的準(zhǔn)確率;基于實(shí)例分割圖,確定分類概率值,分類概率值用于表征實(shí)例分割圖為文字圖像的概率;基于與實(shí)例分割圖對應(yīng)的實(shí)例分割參數(shù)和分類概率值的加權(quán)和,將符合預(yù)設(shè)條件的實(shí)例分割圖的集合確定為待識別文字的特征信息。
在一些實(shí)施例中,在基于目標(biāo)識別結(jié)果,確定圖像中的文字之前還包括:基于預(yù)設(shè)詞庫,對目標(biāo)識別結(jié)果進(jìn)行修正。
在一些實(shí)施例中,在基于目標(biāo)識別結(jié)果,確定圖像中的文字之后還包括:響應(yīng)于接收到針對圖像中的文字的修改指令,將修改后的文字確定為圖像中的文字。
第二方面,本公開的實(shí)施例提供了一種用于識別文字的裝置,裝置包括:獲取單元,被配置成獲取目標(biāo)區(qū)域的圖像,目標(biāo)區(qū)域為表面上存在凹凸結(jié)構(gòu)且凹凸結(jié)構(gòu)形成待識別文字的區(qū)域,圖像為采用平行光以預(yù)設(shè)角度照射于目標(biāo)區(qū)域時所采集的圖像;特征單元,被配置成將圖像輸入預(yù)訓(xùn)練的目標(biāo)特征提取模型,獲得對應(yīng)圖像中的待識別文字的特征信息;識別單元,被配置成將對應(yīng)圖像中的待識別文字的特征信息輸入預(yù)訓(xùn)練的目標(biāo)文字識別模型,獲得對應(yīng)圖像的目標(biāo)識別結(jié)果;確定單元,被配置成基于對應(yīng)圖像的目標(biāo)識別結(jié)果,確定圖像中的文字。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010097553.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





