[發明專利]一種文字檢測中使用的高效解碼方法有效
| 申請號: | 202011413971.0 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112541417B | 公開(公告)日: | 2022-09-16 |
| 發明(設計)人: | 吳軍;張伯政;樊昭磊;何彬彬 | 申請(專利權)人: | 山東眾陽健康科技集團有限公司 |
| 主分類號: | G06V10/94 | 分類號: | G06V10/94;G06V30/41 |
| 代理公司: | 濟南泉城專利商標事務所 37218 | 代理人: | 支文彬 |
| 地址: | 250001 山東省濟南市市轄區*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 文字 檢測 使用 高效 解碼 方法 | ||
1.一種文字檢測中使用的高效解碼方法,其特征在于,包括如下步驟:
a)獲取運行參數,將目標圖像內像素的激活閾值表示為Ti,將頭部和尾部回歸像素的激活閾值表示為Ts,將尾部回歸像素的激活閾值表示為Tt;
b)獲取Advanced-East模型的輸出張量并表示為P,使用P(i,:,:)表示張量P中第一個維度索引為i,第二個維度索引全部區域,第三個維度索引全部區域,P(0,:,:)為目標內像素的激活概率,P(1,:,:)為頭部和尾部回歸像素的激活概率;P(2,:,:)為尾部回歸像素的激活概率;P(3,:,:)為頭部回歸像素的左上點橫向坐標的差值或尾部回歸像素的右下點橫向坐標的差值,P(4,:,:)代表頭部回歸像素的左上點縱向坐標的差值或尾部回歸像素點右下點縱向坐標的差值,P(5,:,:)代表頭部回歸像素的左下點橫向坐標的差值或尾部回歸像素點右上點橫向坐標的差值,P(6,:,:)代表頭部回歸像素的左下點縱向坐標的差值或尾部回歸像素點右上點縱向坐標的差值,獲取像素的坐標圖,表示為張量M,張量M橫向第l列中縱向第n個像素的坐標為M(:,l,n);
c)設置空集合R,用于收集結果;
d)使用高斯模糊方法,對P(0,:,:)進行模糊處理,模糊后的P(0,:,:)表示為PG(0,:,:);
e)對PG(0,:,:)進行二值化處理,處理后的PG(0,:,:)表示為PB(0,:,:);
f)使用連通域分析算法求取PB(0,:,:)中的連通域,將得到的結果表示為矩陣A和值N,矩陣A為每個像素對應的連通域標號,值N為連通域的個數;
g)設置循環變量k=0;
h)設置臨時變量Yi,通過公式計算更新Yi的值,式中*為矩陣對應位置相乘的計算,==為相等的邏輯計算;
i)如果Yi>Ti,則執行步驟j),如果Yi≤Ti,則使用公式k=k+1更新k的值后,返回執行步驟h);
j)設置臨時變量Ys,通過公式Ys=∑[(A==k)*(P(1,:,:)>Ts)]計算更新Ys的值,式中>為大于的邏輯計算;
k)如果Ys>0,則執行步驟l),如果Ys≤0,則使用公式k=k+1更新k的值后,返回執行步驟h);
l)設置臨時變量TM,使用公式TM=(A==k)*(P(1,:,:)>Ts)計算更新TM的值,計算得到目標左上角的橫向坐標AX1、目標左下角的橫向坐標AX2、目標右下角的橫向坐標AX3以及目標右上角的橫向坐標AX4,將集合{AX1,AX2,AX3,AX4}存入集合R中,如果k<N則使用公式k=k+1更新k的值后,返回執行步驟h),如果k≥N,則執行步驟m);
m)最終集合R為最終解碼輸出的結果。
2.根據權利要求1所述的文字檢測中使用的高效解碼方法,其特征在于:步驟b)中張量P的維度為(7,w,h),w為輸出的寬度,h為輸出的高度。
3.根據權利要求1所述的文字檢測中使用的高效解碼方法,其特征在于:步驟b)中張量M的維度為(2,w,h)。
4.根據權利要求1所述的文字檢測中使用的高效解碼方法,其特征在于,步驟
l)中AX1、AX2、AX3、AX4的計算方法為:
l-1)
計算得到AX1,式中P(3:5,:,:)為張量P的第一個維度取3到5,但不包括5,第二個維度和第三個維度全部包括的區域;
l-2)
計算得到AX2,式中P(5:7,:,:)為張量P的第一個維度取5到7,但不包括7,第二個維度和第三個維度全部包括的區域;
l-3)
計算得到AX3;
l-4)
計算得到AX4。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東眾陽健康科技集團有限公司,未經山東眾陽健康科技集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011413971.0/1.html,轉載請聲明來源鉆瓜專利網。





