[發明專利]用于識別文字的方法和裝置有效

申請號：	202010097553.9	申請日：	2020-02-17
公開（公告）號：	CN111291761B	公開（公告）日：	2023-08-04
發明（設計）人：	馮博豪;陳興波;張小帥	申請（專利權）人：	北京百度網訊科技有限公司
主分類號：	G06V20/62	分類號：	G06V20/62;G06V30/148;G06V30/18;G06V30/19
代理公司：	北京英賽嘉華知識產權代理有限責任公司 11204	代理人：	王達佐;馬曉亞
地址：	100085 北京市***	國省代碼：	北京;11
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	用于識別文字方法裝置
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種用于識別文字的方法，包括：

分別從目標區域的不同側，獲取平行光以不同的預設角度照射于所述目標區域所形成的多個圖像，所述目標區域為表面上存在凹凸結構且所述凹凸結構形成待識別文字的區域，所述圖像為采用平行光以預設角度照射于所述目標區域時所采集的圖像，用于采集所述圖像的圖像采集設備設置于平行光的反射光路上；

將所述多個圖像輸入預訓練的目標特征提取模型，獲得對應所述多個圖像中的待識別文字的多個特征信息；

將所述對應所述多個圖像中的待識別文字的多個特征信息輸入預訓練的目標文字識別模型，獲得對應所述圖像的多個目標識別結果；

通過所述多個目標識別結果之間的比對分析，對所述多個目標識別結果進行修正；

基于所述對應所述圖像的目標識別結果，確定所述圖像中的文字，包括：基于所述對應所述多個圖像的修正后的目標識別結果中重復率最高的目標識別結果，確定所述圖像中的文字。

2.根據權利要求1所述的方法，其中，將所述圖像輸入預訓練的目標特征提取模型，獲得對應所述圖像中的待識別文字的特征信息，包括：

將所述圖像輸入所述目標特征提取模型中的特征提取網絡，獲得所述圖像中每個像素點的特征值，所述特征值用于表征該像素點是否存在待識別文字；以及

在所述目標特征提取模型中，還執行以下操作：基于所述特征值，確定所述待識別文字在所述圖像中的位置；基于所述待識別文字在所述圖像中的位置，對所述圖像進行實例分割，得到實例分割圖和實例分割參數，所述實例分割參數用于表征對應的實例分割圖的準確率；基于所述實例分割圖，確定分類概率值，所述分類概率值用于表征所述實例分割圖為文字圖像的概率；基于與所述實例分割圖對應的所述實例分割參數和所述分類概率值的加權和，將符合預設條件的實例分割圖的集合確定為所述待識別文字的特征信息。

3.根據權利要求1至2之一所述的方法，其中，在所述基于所述目標識別結果，確定所述圖像中的文字之前還包括：

基于預設詞庫，對所述目標識別結果進行修正。

4.根據權利要求3所述的方法，其中，在所述基于所述目標識別結果，確定所述圖像中的文字之后還包括：

響應于接收到針對所述圖像中的文字的修改指令，將修改后的文字確定為所述圖像中的文字。

5.一種用于識別文字的裝置，包括：

獲取單元，被配置成分別從目標區域的不同側，獲取平行光以不同的預設角度照射于所述目標區域所形成的多個圖像，所述目標區域為表面上存在凹凸結構且所述凹凸結構形成待識別文字的區域，所述圖像為采用平行光以預設角度照射于所述目標區域時所采集的圖像，用于采集所述圖像的圖像采集設備設置于平行光的反射光路上；

特征單元，被配置成將所述多個圖像輸入預訓練的目標特征提取模型，獲得對應所述多個圖像中的待識別文字的多個特征信息；

識別單元，被配置成將所述對應所述多個圖像中的待識別文字的多個特征信息輸入預訓練的目標文字識別模型，獲得對應所述圖像的多個目標識別結果；

修正單元，被配置成通過所述多個目標識別結果之間的比對分析，對所述多個目標識別結果進行修正；

確定單元，被配置成基于所述對應所述圖像的目標識別結果，確定所述圖像中的文字，包括：基于所述對應所述多個圖像的修正后的目標識別結果中重復率最高的目標識別結果，確定所述圖像中的文字。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載