[發明專利]一種基于多通道字典的物體識別方法在審
| 申請號: | 201711258299.0 | 申請日: | 2017-12-04 |
| 公開(公告)號: | CN108090505A | 公開(公告)日: | 2018-05-29 |
| 發明(設計)人: | 李俊;李琦銘;蘭曉東 | 申請(專利權)人: | 泉州裝備制造研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/00 |
| 代理公司: | 泉州市文華專利代理有限公司 35205 | 代理人: | 陳云川 |
| 地址: | 362000 福建省泉州市臺商投*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多通道 物體識別 字典 鏈接特征 準確率 物體特征 算法 算法構建 特征信息 物體類別 字典學習 差異性 構建 抽象 學習 | ||
1.一種基于多通道字典的物體識別方法,其特征在于:包括以下步驟:
步驟1、獲取多通道字典
對RGB-D數據庫中的圖片進行采樣,采樣時對紅色、綠色、藍色三個通道進行獨立采樣;然后設定初始字典,根據采樣信息得到初始稀疏編碼,采用SVD算法進行迭代,不斷縮小樣本值與稀疏編碼之間的誤差,直到收斂為止,得到多通道字典,即紅色字典、綠色字典和藍色字典;
步驟2、構建多通道字典算法
步驟2.1、將待識別物體的圖像進行多通道字典學習,得到物體圖像的其中一個顏色字典,基于該顏色字典,采用omp算法獲取相應顏色通道的像素稀疏編碼矩陣;
步驟2.2、基于稀疏編碼矩陣在K*K像素上進行最大池化處理得到單元特征,將M*M個單元特征按列串聯起來得到塊連接特征,多個塊鏈接特征形成塊鏈接特征矩陣;
步驟2.3、將塊鏈接特征矩陣再次學習多通道字典,得到與步驟3中的顏色通道相對應的新顏色字典,基于該新顏色字典,采用omp算法獲取該顏色通道的塊鏈接特征矩陣的稀疏編碼矩陣;
步驟2.4、對塊鏈接特征矩陣的稀疏編碼矩陣進行簡化的金字塔池化處理得到相應顏色通道的圖像級別特征;
其中,金字塔將塊鏈接特征矩陣劃分為三層,第一層將塊鏈接特征矩陣劃分為1*1個子區域,第二層將塊鏈接特征矩陣劃分為2*2個子區域,第三層將塊鏈接特征矩陣劃分為3*3個子區域,共14個子區域;然后對每個子區域的塊鏈接特征進行最大池化處理,得到子區域特征,將每個子區域特征按列串聯得到相應通道的圖像級別特征;
步驟2.5、重復步驟2.1至步驟2.4,獲取其他兩個顏色通道的圖像級別特征,然后將三個顏色通道即紅色通道、綠色通道和藍色通道的圖像級別特征按列串聯起來形成物體的圖像特征;
步驟3、構建物體特征模型
將從RGB-D object數據庫的每一類物體中隨機選擇一個物體的所有圖片作為測試集,其他的都作為訓練集;采用步驟2中的多通道字典算法對測試集和訓練集中的圖片進行處理,得到測試集的圖像特征和訓練集的圖像特征,將訓練集的圖像特征通過linear-SVM分類器進行訓練得到物體特征模型;然后采用測試集的圖像特征與物體特征模型比較計算準確率并得到最后的分類結果;
步驟4、物體識別
將待識別物體通過步驟2中的多通道字典學習算法獲取帶識別物體的圖像特征,將該待識別物體的圖像特征與步驟3中的物體特征模型進行比較,得到識別結果。
2.根據權利要求1所述的基于多通道字典的物體識別方法,其特征在于:所述塊鏈接特征的尺寸為4,即M等于4。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于泉州裝備制造研究所,未經泉州裝備制造研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711258299.0/1.html,轉載請聲明來源鉆瓜專利網。





