[發(fā)明專利]一種基于決策樹的數(shù)碼管識別方法有效
| 申請?zhí)枺?/td> | 202010719933.1 | 申請日: | 2020-07-24 |
| 公開(公告)號: | CN111832565B | 公開(公告)日: | 2022-10-28 |
| 發(fā)明(設(shè)計)人: | 閆坤;李慧慧;張李軒;劉威;李執(zhí);陳德富;傅琪 | 申請(專利權(quán))人: | 桂林電子科技大學(xué) |
| 主分類號: | G06V20/62 | 分類號: | G06V20/62;G06V10/26;G06V10/764;G06V30/10 |
| 代理公司: | 桂林市華杰專利商標(biāo)事務(wù)所有限責(zé)任公司 45112 | 代理人: | 覃永峰 |
| 地址: | 541004 廣西*** | 國省代碼: | 廣西;45 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 決策樹 數(shù)碼管 識別 方法 | ||
本發(fā)明公開了一種基于決策樹的數(shù)碼管識別方法,其特征在于,包括如下步驟:1)圖像采集;2)預(yù)處理;3)數(shù)碼管識別。這種方法適用于工業(yè)場景,能夠提高復(fù)雜環(huán)境下數(shù)碼管識別的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及計算機圖像處理技術(shù)領(lǐng)域,具體是一種基于決策樹的數(shù)碼管識別方法。
背景技術(shù)
現(xiàn)有技術(shù)中,數(shù)碼管識別技術(shù)難點主要是在復(fù)雜工業(yè)環(huán)境中,常用的識別方法無法完成數(shù)字區(qū)域與背景區(qū)域的高精度分割,進而影響后續(xù)識別的準(zhǔn)確度。在數(shù)碼管識別方面,有僅適用于帶背光顯示器的數(shù)字識別檢測算法,該算法無法適應(yīng)無背光的數(shù)碼管識別;有針對干凈圖片采用筆畫寬度變換定位感興趣區(qū)域,并使用支持向量機來進一步篩選的算法,但算法的輸入圖片較為理想,并不是在現(xiàn)實情況下捕獲的;有利用OCR技術(shù)從數(shù)字萬用表和其他類似的數(shù)字顯示設(shè)備中獲取自動數(shù)據(jù)的系統(tǒng),此系統(tǒng)可以自動檢測小數(shù)點和負(fù)號,不過該系統(tǒng)只針對七段顯示數(shù)碼管。目前基于圖像的數(shù)碼管自動識別方法在復(fù)雜的工業(yè)環(huán)境中存在模型失配、適應(yīng)性不強、準(zhǔn)確度較低的問題。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對現(xiàn)有技術(shù)的不足,而提供一種基于決策樹的數(shù)碼管識別方法。這種方法適用于工業(yè)場景,能夠提高復(fù)雜環(huán)境下數(shù)碼管識別的效率。
實現(xiàn)本發(fā)明目的的技術(shù)方案是:
一種基于決策樹的數(shù)碼管識別方法,包括如下步驟:
1)圖像采集:圖像采集就是獲取圖像中圖案的掃描圖像即數(shù)字圖像的過程,假設(shè)捕獲圖像中的數(shù)碼管所在區(qū)域即數(shù)碼管ROI為已知,從采集到的圖像中提取出數(shù)碼管區(qū)域,用于后續(xù)處理;
2)預(yù)處理:對步驟1)得到的數(shù)碼管ROI進行預(yù)處理,首先,對數(shù)碼管ROI進行灰度化得到灰度圖,計算灰度圖的Tsallis熵,采用基于決策樹的二值化方法對數(shù)碼管ROI的灰度圖進行二值化處理,圖像二值化后進行噪聲消除,采用邊緣消除、膨脹和填充去除圖像中噪點,最后對不同尺寸的數(shù)碼管ROI進行尺寸歸一,方便后續(xù)處理;
3)數(shù)碼管識別:對步驟2)得到的尺寸歸一后的數(shù)碼管ROI進行識別,包括三個過程:數(shù)字分割、特征提取和數(shù)值判定,以數(shù)碼管色塊分布特征為依據(jù)進行實時自適應(yīng)的數(shù)字分割,最后估計特征編碼數(shù)值。
步驟2)中所述的決策樹的二值化方法為:
2-1)計算數(shù)碼管ROI對應(yīng)的灰度頻數(shù)分布,數(shù)碼管ROI對應(yīng)的灰度頻數(shù)分布為公式(1)所示:
其中I,J分別為數(shù)碼管ROI的行像素數(shù)與列像素數(shù),Q(k)為對應(yīng)特定灰度的像素點數(shù)和,k=1,2,3...256;
2-2)計算數(shù)碼管ROI灰度均值:數(shù)碼管ROI灰度均值為公式(2)所示:其中k為灰度值,P(k)為相應(yīng)灰度值的灰度頻數(shù);
2-3)計算Tsallis熵:Tsallis熵為公式(3)所示:
其中,q為Tsallis熵的系數(shù),Tsallis熵是香農(nóng)熵的擴展,當(dāng)可調(diào)參數(shù)q→1時,Tsallis熵等價為香農(nóng)熵,通過調(diào)整q值可以在圖像分析中更好地度量圖像中不同特征區(qū)域的狀態(tài)差異;
2-4)在Tsallis熵-灰度均值平面上,正常光線、過度曝光、設(shè)備關(guān)機三種狀態(tài)下圖像度量值能夠被決策樹分割,依據(jù)這一特征,采用灰度均值和Tsallis熵構(gòu)建雙層決策樹,在Tsallis熵-灰度均值平面上將正常光線、過度曝光、設(shè)備關(guān)機三種狀態(tài)下的圖像度量值分開,過程為:
依據(jù)決策樹判斷圖片所屬場景,進而采用適配不同場景的灰度圖二值化方法,并計算門限值∈,其中,場景包括:
2-4-1)設(shè)備關(guān)機:二值化門限選為灰度最大值,使得二值化圖片中數(shù)碼管區(qū)域與背景區(qū)域一致:∈=maxi,jp(i,j);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于桂林電子科技大學(xué),未經(jīng)桂林電子科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010719933.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





