[發(fā)明專利]一種文字檢測(cè)中使用的高效解碼方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011413971.0 | 申請(qǐng)日: | 2020-12-03 |
| 公開(公告)號(hào): | CN112541417B | 公開(公告)日: | 2022-09-16 |
| 發(fā)明(設(shè)計(jì))人: | 吳軍;張伯政;樊昭磊;何彬彬 | 申請(qǐng)(專利權(quán))人: | 山東眾陽(yáng)健康科技集團(tuán)有限公司 |
| 主分類號(hào): | G06V10/94 | 分類號(hào): | G06V10/94;G06V30/41 |
| 代理公司: | 濟(jì)南泉城專利商標(biāo)事務(wù)所 37218 | 代理人: | 支文彬 |
| 地址: | 250001 山東省濟(jì)南市市轄區(qū)*** | 國(guó)省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 文字 檢測(cè) 使用 高效 解碼 方法 | ||
一種文字檢測(cè)中使用的高效解碼方法,使用張量之間的邏輯與按位計(jì)算取代了傳統(tǒng)的解碼方法中的像素迭代計(jì)算,本專利的文字檢測(cè)中使用的解碼方法更容易進(jìn)行并行計(jì)算加速,即使不進(jìn)行并行計(jì)算加速,也可以借助X86架構(gòu)處理器的向量處理單元達(dá)到遠(yuǎn)高于原理解碼方法的處理速度。在保證解碼效果的前提下,降低了解碼的耗時(shí),提高了解碼效率。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像中文字檢測(cè)領(lǐng)域,具體涉及一種文字檢測(cè)中使用的高效解碼方法。
背景技術(shù)
文字檢測(cè)是當(dāng)今圖像領(lǐng)域研究的一個(gè)重要問(wèn)題,在很多行業(yè)領(lǐng)域都有應(yīng)用。而在文字檢測(cè)中,Advanced-East是一種效果優(yōu)異的模型,其本質(zhì)是一種對(duì)目標(biāo)方向和區(qū)域同時(shí)進(jìn)行檢測(cè)的算法模型。該模型中的解碼部分,由于依賴像素級(jí)的迭代,效率較低,且由于其解碼方法在數(shù)據(jù)上存在行或者列的依賴性,并行優(yōu)化的效率提升有限。這造成了現(xiàn)在使用Advanced-East模型在做文字檢測(cè)的時(shí)候,由于解碼部分的效率過(guò)低,導(dǎo)致檢測(cè)的速度較慢。
如何能夠在使用Advanced-East進(jìn)行圖像中文字檢測(cè)時(shí),在保證解碼效果的前提下,降低解碼的耗時(shí)。并在提升效率的同時(shí),降低硬件的開銷。顯得尤為重要。
發(fā)明內(nèi)容
本發(fā)明為了克服以上技術(shù)的不足,提供了一種提高解碼效率、降低硬件成本的文字檢測(cè)中使用的高效解碼方法。
本發(fā)明克服其技術(shù)問(wèn)題所采用的技術(shù)方案是:
一種文字檢測(cè)中使用的高效解碼方法,包括如下步驟:
a)獲取運(yùn)行參數(shù),將目標(biāo)圖像內(nèi)像素的激活閾值表示為Ti,將頭部和尾部回歸像素的激活閾值表示為Ts,將尾部回歸像素的激活閾值表示為Tt;
b)獲取Advanced-East模型的輸出張量并表示為P,使用P(i,:,:)表示張量P中第一個(gè)維度索引為i,第二個(gè)維度索引全部區(qū)域,第三個(gè)維度索引全部區(qū)域,P(0,:,:)為目標(biāo)內(nèi)像素的激活概率,P(1,:,:)為頭部和尾部回歸像素的激活概率;P(2,:,:)為尾部回歸像素的激活概率;P(3,:,:)為頭部回歸像素的左上點(diǎn)橫向坐標(biāo)的差值或尾部回歸像素的右下點(diǎn)橫向坐標(biāo)的差值,P(4,:,:)代表頭部回歸像素的左上點(diǎn)縱向坐標(biāo)的差值或尾部回歸像素點(diǎn)右下點(diǎn)縱向坐標(biāo)的差值,P(5,:,:)代表頭部回歸像素的左下點(diǎn)橫向坐標(biāo)的差值或尾部回歸像素點(diǎn)右上點(diǎn)橫向坐標(biāo)的差值,P(6,:,:)代表頭部回歸像素的左下點(diǎn)縱向坐標(biāo)的差值或尾部回歸像素點(diǎn)右上點(diǎn)縱向坐標(biāo)的差值,獲取像素的坐標(biāo)圖,表示為張量M,張量M橫向第l列中縱向第n個(gè)像素的坐標(biāo)為M(:,l,n);
c)設(shè)置空集合R,用于收集結(jié)果;
d)使用高斯模糊方法,對(duì)P(0,:,:)進(jìn)行模糊處理,模糊后的P(0,:,:)表示為PG(0,:,:);
e)對(duì)PG(0,:,:)進(jìn)行二值化處理,處理后的PG(0,:,:)表示為PB(0,:,:);
f)使用連通域分析算法求取PB(0,:,:)中的連通域,將得到的結(jié)果表示為矩陣A和值N,矩陣A為每個(gè)像素對(duì)應(yīng)的連通域標(biāo)號(hào),值N為連通域的個(gè)數(shù);
g)設(shè)置循環(huán)變量k=0;
h)設(shè)置臨時(shí)變量Yi,通過(guò)公式計(jì)算更新Yi的值,式中*為矩陣對(duì)應(yīng)位置相乘的計(jì)算,==為相等的邏輯計(jì)算;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東眾陽(yáng)健康科技集團(tuán)有限公司,未經(jīng)山東眾陽(yáng)健康科技集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011413971.0/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





