[發(fā)明專利]一種模板匹配的方法及裝置有效
| 申請?zhí)枺?/td> | 201811564354.3 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109726746B | 公開(公告)日: | 2021-02-26 |
| 發(fā)明(設(shè)計)人: | 王楓;毛禮建;孫海濤;任馨怡 | 申請(專利權(quán))人: | 浙江大華技術(shù)股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04 |
| 代理公司: | 北京同達信恒知識產(chǎn)權(quán)代理有限公司 11291 | 代理人: | 黃志華 |
| 地址: | 310053 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 模板 匹配 方法 裝置 | ||
本發(fā)明公開了一種模板匹配的方法及裝置,所述方法包括:分別將模板圖像及待匹配圖像輸入到預(yù)先訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)的卷積層,獲得所述模板圖像的第一特征圖,及所述待匹配圖像的第二特征圖;在所述第二特征圖的每個位置上,使所述第一特征圖與該位置對應(yīng)的第二子特征圖進行特征向量匹配,根據(jù)匹配的特征向量的數(shù)量,確定每個位置對應(yīng)的匹配分值;在所述第二特征圖的每個位置,確定所述第一特征圖在該位置時覆蓋的第二特征圖的范圍,確定該范圍內(nèi)每個位置對應(yīng)的匹配分值和,將匹配分值和最大時對應(yīng)范圍確定的在所述待匹配圖像中的子圖像與所述模板圖像匹配,這樣可以能夠提高模板匹配精準度。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像檢索技術(shù)領(lǐng)域,尤其涉及一種模板匹配的方法及裝置。
背景技術(shù)
模板匹配是研究某一特定對象物的模板圖像位于待匹配圖像的位置,進而識別對象物,它是圖像處理中最基本、最常用的匹配方法。目前常見的模板匹配技術(shù)方案包括:基于像素級信息進行匹配的技術(shù)方案,即直接將模板圖像與待匹配圖像遍歷逐像素相減,計算均方誤差,其中均方誤差最小的那個區(qū)域就是最終匹配到的位置;基于邊緣信息進行匹配的技術(shù)方案,即計算模板圖像和待匹配圖像的邊緣信息,通過邊緣信息匹配的方式,得到最佳匹配位置。
但是,現(xiàn)有的這些模板匹配的技術(shù)方案存在一些局限性,例如當待匹配圖像的成像質(zhì)量發(fā)生很大變化,如光線發(fā)生很大變化時,現(xiàn)有算法的匹配精度會直線下降,甚至匹配不到;由于現(xiàn)有算法均是先通過對模板圖像中物體的描述,然后在待匹配圖像上尋找最佳特定對象物位置,只關(guān)注是否找到特定對象物,輸出結(jié)果中大多都是待匹配的特定對象物位于中間位置,定位不夠精準;當待匹配圖像中的特定對象物相對于模板圖像發(fā)生形變的時候,將無法匹配成功;若模板圖像中的某一特定對象物是實際工業(yè)應(yīng)用中出現(xiàn)復(fù)雜的部件,如中文字符,這種情況很難用現(xiàn)有技術(shù)進行模板匹配。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種模板匹配的方法及裝置,用以解決待匹配圖像因光線變換、物體形變等變化的影響,導(dǎo)致模板匹配精準度下降的問題。
本發(fā)明實施例提供了一種模板匹配的方法,所述方法包括:
分別將模板圖像及待匹配圖像輸入到預(yù)先訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)的卷積層,獲得所述模板圖像的第一特征圖,及所述待匹配圖像的第二特征圖;
在所述第二特征圖的每個位置使所述第一特征圖與該位置對應(yīng)的第二子特征圖進行匹配,根據(jù)匹配的特征向量的數(shù)量,確定每個位置對應(yīng)的匹配分值;
在所述第二特征圖的每個位置,確定所述第一特征圖在該位置時覆蓋的第二特征圖的范圍,確定該范圍內(nèi)每個位置對應(yīng)的匹配分值和,確定匹配分值和最大時對應(yīng)范圍確定的在所述待匹配圖像中的子圖像與所述模板圖像匹配。
進一步地,預(yù)先確定所述卷積神經(jīng)網(wǎng)絡(luò)的卷積層包括:
將VGG-19網(wǎng)絡(luò)中的設(shè)定的卷積層作為確定的所述卷積神經(jīng)網(wǎng)絡(luò)的卷積層。
進一步地,所述設(shè)定的卷積層包括所述VGG-19網(wǎng)絡(luò)中的第二個卷積層,位于所有卷積層中間的卷積層,以及倒數(shù)第二個卷積層。
進一步地,預(yù)先確定所述卷積神經(jīng)網(wǎng)絡(luò)的卷積層中的每個目標卷積核包括:
針對所述設(shè)定的卷積層中的每個卷積層中的每個卷積核,確定該卷積核各個幅度值絕對值的和;對每個卷積核對應(yīng)的和按照從大到小的順序排序,將排序在前的設(shè)定數(shù)量的卷積核作為該卷積層的目標卷積核。
進一步地,所述根據(jù)匹配的特征向量的數(shù)量,確定每個位置對應(yīng)的匹配分值包括:
針對該范圍內(nèi)的每個像素點,根據(jù)該像素點在第一特征圖中對應(yīng)的特征向量,以及在第二子特征圖中對應(yīng)的特征向量,識別相同的特征向量的數(shù)量;
根據(jù)該范圍內(nèi)每個像素點對應(yīng)的特征向量的數(shù)量,確定該位置對應(yīng)的匹配分值。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大華技術(shù)股份有限公司,未經(jīng)浙江大華技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811564354.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





