[發明專利]一種基于嵌入空間像素聚類的文本區域檢測方法有效
| 申請號: | 202110847077.2 | 申請日: | 2021-07-27 |
| 公開(公告)號: | CN113298054B | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 李巖;李斌陽;范曉焓;舒言 | 申請(專利權)人: | 國際關系學院 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京天達知識產權代理事務所(普通合伙) 11386 | 代理人: | 許志宏 |
| 地址: | 100091*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 嵌入 空間 像素 文本 區域 檢測 方法 | ||
1.一種基于嵌入空間像素聚類的文本區域檢測方法,其特征在于,包括以下步驟:
獲得待識別文本圖像的形狀空間的第一原尺寸文本區域預測圖、第一中心線區域預測圖、第一核區域預測圖、第一高度預測圖和第一角度預測圖,所述待識別文本圖像包括至少一個第一不規則文本區域;
基于所述第一原尺寸文本區域預測圖、第一中心線區域預測圖以及第一核區域預測圖,得到第一嵌入空間的第一像素聚類預測圖;
所述第一像素聚類預測圖包括第一聚類中心以及第一聚類像素,所述得到第一嵌入空間的第一像素聚類預測圖,包括:
基于所述第一原尺寸文本區域預測圖,對所述第一中心線區域預測圖以及第一核區域預測圖進行去噪,得到去噪后的第一中心線區域預測圖以及去噪后的第一核區域預測圖;
將所述去噪后的第一核區域預測圖中的文本核區域在所述第一嵌入空間中形成初始聚類中心;
判斷任意兩個初始聚類中心之間的嵌入距離,結合初始聚類中心以及第一預設距離,得到第一聚類中心;
遍歷去噪后的第一中心線區域預測圖中的文本中心線區域中的每個像素,計算每個像素在第一嵌入空間對應的聚類像素至其對應的第一聚類中心的嵌入距離,結合第二預設距離,得到去噪后的第一中心線區域預測圖中的文本中心線區域聚類在第一聚類中心周圍的第一聚類像素;
基于所述第一像素聚類預測圖對所述第一中心線區域預測圖進行優化,得到形狀空間的優化第一中心線區域預測圖;
基于所述優化第一中心線區域預測圖,結合所述第一高度預測圖以及所述第一角度預測圖,得到待識別文本圖像中文本區域位置,包括:
基于所述優化第一中心線區域預測圖中每個像素在所述第一高度預測圖中對應像素的高度以及第一角度預測圖中對應像素的角度,得到所述優化第一中心線區域預測圖中的文本中心線區域對應的多個局部框;
將所述局部框頂邊的中點以及底邊的中點順序連接,得到待識別文本圖像中文本區域位置。
2.根據權利要求1所述的方法,其特征在于,所述得到去噪后的第一中心線區域預測圖以及去噪后的第一核區域預測圖,包括:
將所述第一中心線區域預測圖與所述第一原尺寸文本區域預測圖做與運算,得到去噪后的第一中心線區域預測圖;
將所述第一核區域預測圖與所述第一原尺寸文本區域預測圖做與運算,得到去噪后的第一核區域預測圖。
3.根據權利要求1所述的方法,其特征在于,所述得到第一聚類中心,包括:
判斷任意兩個初始聚類中心之間的嵌入距離是否小于第一預設距離;
若小于,則將該兩個初始聚類中心設定為相同的標簽,標定為同一第一聚類中心。
4.根據權利要求1至3任一項所述的方法,其特征在于,所述方法包括將待識別文本圖像輸入訓練好的文本檢測模型,獲得待識別文本圖像的形狀空間的所述第一原尺寸文本區域預測圖、所述第一中心線區域預測圖、所述第一核區域預測圖、所述第一高度預測圖和所述第一角度預測圖;通過下述方法獲得訓練好的文本檢測模型:
將訓練數據集輸入初始文本檢測模型,獲得形狀空間的第二原尺寸文本區域預測圖、第二中心線區域預測圖、第二核區域預測圖、第二高度預測圖以及第二角度預測圖,所述訓練數據集包括文本圖像以及與所述文本圖像對應的文本區域位置標注信息,所述文本圖像包括至少一個第二不規則文本區域;
基于所述第二中心線區域預測圖、第二核區域預測圖,得到第二嵌入空間的第二像素聚類預測圖;
利用訓練過程中的損失函數,根據所述第二原尺寸文本區域預測圖、原尺寸文本區域真值圖、所述第二中心線區域預測圖、中心線區域真值圖、所述第二核區域預測圖、核區域真值圖、所述第二高度預測圖、高度真值圖、所述第二角度預測圖、角度真值圖以及所述第二像素聚類預測圖,計算訓練過程中的誤差值;
利用誤差反向傳播機制,根據訓練過程中的誤差值,獲得訓練好的文本檢測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際關系學院,未經國際關系學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110847077.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多用途雷達天線系統
- 下一篇:高速沖模具冷卻裝置





