[發明專利]光學字符識別方法、裝置和電子設備在審
| 申請號: | 202011513721.4 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112488094A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 盧永晨 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62 |
| 代理公司: | 泰和泰律師事務所 51219 | 代理人: | 祝海燕 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 光學 字符 識別 方法 裝置 電子設備 | ||
本公開實施例公開了光學字符識別方法、裝置和電子設備。該方法的一具體實施方式包括:獲取第一字符圖像,其中,所述第一字符圖像包括至少兩個字符元素;對所述第一字符圖像進行分類,生成分類結果,其中,所述分類結果包括字符元素在字符圖像方向的排布方向,所述字符圖像方向用于指示具有語意聯系的相鄰字符之間的位置關系,所述排布方向用于指示字符元素按照語意的走向;基于所述分類結果和所述第一字符圖像,生成第二字符圖像;對所述第二字符圖像進行光學字符識別,得到識別結果。由此,提供了一種新的光學字符識別方式。
技術領域
本公開涉及互聯網技術領域,尤其涉及一種光學字符識別方法、裝置和電子設備。
背景技術
隨著互聯網的發展,用戶越來越多的使用終端設備實現各種功能。例如,隨著智能設備的普及,人們可以輕易的獲取圖像。文本作為圖像中的高層語義信息,能夠幫助人們更好的理解圖像。將圖像中的文本信息轉換為計算機可讀可編輯的字符,對于提高多媒體檢索能力、工業自動化水平、場景理解能力等具有重要意義。
發明內容
提供該公開內容部分以便以簡要的形式介紹構思,這些構思將在后面的具體實施方式部分被詳細描述。該公開內容部分并不旨在標識要求保護的技術方案的關鍵特征或必要特征,也不旨在用于限制所要求的保護的技術方案的范圍。
第一方面,本公開實施例提供了一種光學字符識別方法,該方法包括:獲取第一字符圖像,其中,所述第一字符圖像包括至少兩個字符元素;對所述第一字符圖像進行分類,生成分類結果,其中,所述分類結果包括字符元素在字符圖像方向的排布方向,所述字符圖像方向用于指示具有語意聯系的相鄰字符之間的位置關系,所述排布方向用于指示字符元素按照語意的走向;基于所述分類結果和所述第一字符圖像,生成第二字符圖像;對所述第二字符圖像進行光學字符識別,得到識別結果。
第二方面,本公開實施例提供了一種光學字符識別裝置,包括:獲取單元,用于獲取第一字符圖像,其中,所述第一字符圖像包括至少兩個字符元素;分類單元,用于對所述第一字符圖像進行分類,生成分類結果,其中,所述分類結果包括字符元素在字符圖像方向的排布方向,所述字符圖像方向用于指示具有語意聯系的相鄰字符之間的位置關系,所述排布方向用于指示字符元素按照語意的走向;生成單元,用于基于所述分類結果和所述第一字符圖像,生成第二字符圖像;識別單元,用于對所述第二字符圖像進行光學字符識別,得到識別結果。
第三方面,本公開實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如第一方面所述的光學字符識別方法。
第四方面,本公開實施例提供了一種計算機可讀介質,其上存儲有計算機程序,該程序被處理器執行時實現如第一方面所述的光學字符識別方法的步驟。
本公開實施例提供的光學字符識別方法、裝置和電子設備,在進行光學字符識別之前,對第一字符圖像進行分類,生成分類結果,并且分類結果可以包括字符元素在字符圖像方向的排布方向。由此,可以獲取具有語意聯系的字符元素的正確走向,盡量避免了識別結果不符合語意的情況出現,提高了識別結果的準確率。
附圖說明
結合附圖并參考以下具體實施方式,本公開各實施例的上述和其他特征、優點及方面將變得更加明顯。貫穿附圖中,相同或相似的附圖標記表示相同或相似的元素。應當理解附圖是示意性的,原件和元素不一定按照比例繪制。
圖1是根據本公開的光學字符識別方法的一個實施例的流程圖;
圖2A和圖2B是根據本公開的光學字符識別方法的一個應用場景的示意圖
圖3A和圖3B是根據本公開的光學字符識別方法的一個應用場景的示意圖;
圖4是根據本公開的光學字符識別方法的另一個實施例的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011513721.4/2.html,轉載請聲明來源鉆瓜專利網。





