[發明專利]一種文字定位方法、裝置及設備有效
| 申請號: | 202010692775.5 | 申請日: | 2020-07-17 |
| 公開(公告)號: | CN111881916B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 盧健 | 申請(專利權)人: | 中國工商銀行股份有限公司 |
| 主分類號: | G06V30/148 | 分類號: | G06V30/148;G06V30/40 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 周達;劉飛 |
| 地址: | 100140 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 定位 方法 裝置 設備 | ||
本說明書實施例公開了一種文字定位方法、裝置及設備,所述方法包括獲取包括文字的原始圖像;基于原始圖像生成多個中間圖像;中間圖像包括預計文字區域和預計背景區域;分別對應多個中間圖像生成多個二值矩陣;以預計文字區域的面積最小的中間圖像對應的二值矩陣作為基準矩陣,以其他中間圖像對應的二值矩陣作為約束矩陣。對應所述預計文字區域的元素為第一取值,對應所述預計背景區域的元素為第二取值。以中間圖像的預計文字區域的面積順次增大的順序,選擇約束矩陣,對所述基準矩陣中第一取值的元素的數量進行擴展處理,利用目標二值矩陣中第一取值的元素確定所述原始圖像中的文字所在位置。利用本說明書各個實施例,可以提高文字定位的效率。
技術領域
本說明書涉及文字識別技術領域,特別地,涉及一種文字定位方法、裝置及設備。
背景技術
文字識別是一種從圖像中提取出文字字符的方法,而文字定位則是文字識別任務中的重要環節。目前,文字定位的方法主要有兩種,一種是基于檢測框的目標檢測方法,一種是基于像素的實例分割方法。目前的實例分割方法中,在獲得分割圖像后,可采用如漸進擴展等方法進一步定位各文字字符,以便于準確識別各文字字符。但目前的實例分割方法中多采用隊列的方式進行擴展處理,該方式需要遍歷文字區域相鄰的各像素點,因此擴展處理效率較低。而隨著文字識別技術的應用越來越廣泛,文字識別的數據處理量也越來越大,如何進一步提高文字定位的效率,進而提高文字識別的效率,成為亟待解決的技術問題。
發明內容
本說明書實施例的目的在于提供一種文字定位方法、裝置及設備,可以進一步提高文字定位的效率。
本說明書提供一種文字定位方法、裝置及設備是包括如下方式實現的:
一種文字定位方法,應用于服務器,包括:獲取包括文字的原始圖像。基于所述原始圖像生成多個中間圖像;其中,所述中間圖像包括表示預計文字區域的顏色和表示預計背景區域的顏色;所述多個中間圖像的預計文字區域的面積不同。分別對應所述多個中間圖像生成多個二值矩陣;其中,以預計文字區域的面積最小的中間圖像對應的二值矩陣作為基準矩陣,以除預計文字區域的面積最小的中間圖像之外的中間圖像對應的二值矩陣作為約束矩陣;其中,與中間圖像對應的二值矩陣中,對應所述預計文字區域的元素為第一取值,以及對應所述預計背景區域的元素為第二取值。以中間圖像的預計文字區域的面積順次增大的順序,選擇約束矩陣,對所述基準矩陣中第一取值的元素的數量進行擴展處理,得到目標二值矩陣;其中,所述目標二值矩陣中第一取值的元素對應的所述原始圖像中的區域為文字區域。
本說明書提供的所述方法的另一些實施例中,所述對所述基準矩陣中第一取值的元素的數量進行擴展處理,包括:確定所述基準矩陣中對應預計文字區域的外邊界的第一位置信息。基于所述第一位置信息執行下述擴展步驟:獲取選擇的約束矩陣中所述第一位置信息所對應的元素的取值;在獲取的取值中存在第一取值的情況下,根據所述獲取的取值對所述基準矩陣中第一取值的元素的數量進行擴展處理。
本說明書提供的所述方法的另一些實施例中,所述對所述基準矩陣中第一取值的元素的數量進行擴展處理,包括:確定所述獲取的取值中第一取值的元素所對應的第二位置信息。將所述基準矩陣中第二位置信息所對應的元素的取值更新為第一取值,獲得擴展后的基準矩陣。
本說明書提供的所述方法的另一些實施例中,所述對所述基準矩陣中第一取值的元素的數量進行擴展處理,包括:將所述基準矩陣中所述第一位置信息所對應的元素的取值更新為所述獲取的取值中相應第一位置信息所對應的元素的取值。
本說明書提供的所述方法的另一些實施例中,所述確定所述基準矩陣中對應預計文字區域的外邊界的第一位置信息,包括:以所述基準矩陣的維度范圍為限制,將所述基準矩陣中第一取值的元素的位置分別向四周平移一個元素單位。將平移后的基準矩陣與平移前的基準矩陣進行矩陣運算,得到邊界矩陣。將所述邊界矩陣中第一取值的元素的位置信息作為所述基準矩陣中對應預計文字區域的外邊界的第一位置信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國工商銀行股份有限公司,未經中國工商銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010692775.5/2.html,轉載請聲明來源鉆瓜專利網。





