[發明專利]一種基于多視角譜聚類的圖像識別方法在審
| 申請號: | 201611204912.6 | 申請日: | 2016-12-23 |
| 公開(公告)號: | CN106599932A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 李陽;張元元;姜樹明;李鳳嬌;聶明鈺 | 申請(專利權)人: | 山東省科學院情報研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 濟南圣達知識產權代理有限公司37221 | 代理人: | 李健康 |
| 地址: | 250014 山*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 視角 譜聚類 圖像 識別 方法 | ||
技術領域
本發明涉及一種基于多視角特征的圖像識別方法,特別涉及到一種基于Hessian正則化的多視角譜聚類的圖像識別方法,屬于圖像識別領域。
背景技術
隨著計算機技術和存儲技術的不斷發展,大數據量的圖像獲取也越來越容易。圖像識別是對輸入的圖像信息分析并提取圖像的特征,根據圖像的特征進行識別分類的技術,是模式識別與人工智能領域的研究熱點。在實際應用中,大部分圖像信息都是未標記的,對數據標記費時費力。隨著社會的需要,需要分類識別對象的內容越來越復雜,如何能高效準確地將大量未標記圖像數據進行識別分類是當前研究的熱點問題。
譜聚類算法是無監督學習的一個重要的研究方向。它以圖論作為理論基礎,將聚類問題轉化為圖論中的對無向加權圖的最優分割問題。
現有的多視角的圖像識別方法大多是基于拉普拉斯正則化的多視角譜聚類方法,首先分別構造不同視角樣本之間的相似度矩陣,然后計算其拉普拉斯矩陣,求取其特征值及特征向量,再根據合適的特征向量聚類不同的數據點。
拉普拉斯正則化是基于函數的一階導數,Hessian正則化是基于對模型誤差泛函參數的二階導數,相比于拉普拉斯,Hessian方法能夠更準確地描述數據潛在的局部幾何特征,反應出更精細的局部結構,從而有更好的識別精確度。
發明內容
為實現有效的多視角圖像識別,本發明提出一種基于Hessian正則化的多視角譜聚類的圖像識別方法。該方法利用Hessian矩陣更好的挖掘出樣本數據的內部結構信息,并通過多視角之間Hessian矩陣的相互修正實現信息互換,從而使樣本的多視角信息可以得到充分且有效的利用,提高識別的準確度。
本發明提出的技術方案如下:
一種基于Hessian正則化的多視角譜聚類的圖像識別方法,其特征在于:該方法利用圖像樣本的Hessian矩陣,更好的獲取樣本內部結構信息,通過多視角之間Hessian矩陣的不斷修正,提高Hessian矩陣對聚類效果提升的貢獻,具體包括如下步驟:
(1)提取輸入圖像的兩個不同視角的特征;
(2)分別計算每個視角的Hessian矩陣,第一視角樣本的Hessian矩陣用H1表示,第二視角樣本的Hessian矩陣用H2表示;
(3)將矩陣H1和H2分別進行歸一化處理,分別求取前k個最大的特征值及其對應的特征向量,并將所述兩個視角各自的特征向量分別按列排成矩陣U1和U2;
(4)對每一個視角,將其Hessian矩陣沿著另一個視角獲取的特征向量方向投影,從而獲取聚類的有效信息,摒棄聚類無關信息,然后再投影回n維空間中,這樣就得到了修正后的該視角的Hessian矩陣;
(5)將步驟(3)和(4)迭代規定的次數后,選取兩個視角中具有代表性的最終修正的Hessian矩陣,求取前k個最大的特征值及其對應的特征向量,利用K-means方法聚類。
更具體地,所述不同視角是指同一圖像的不同方面,可以是不同的顏色信息、形狀信息,可以是高頻分量和低頻分量,也可以是兩種不同特征提取方法獲取的特征。
更具體地,步驟(1)還包括將提取的特征數據通過低通濾波去除高頻噪聲,以及對去噪后的數據進行降維和歸一化處理。
更具體地,步驟(4)中,各視角Hessian矩陣的修正方法為:和其中sym(S)=(S+ST)/2,S1和S2分別是兩個視角修正后的Hessian矩陣,符號T表示矩陣轉置運算。
附圖說明
圖1所示為圖像識別裝置的工作流程圖;
圖2所示為本發明方法的流程圖;
圖3所示為本發明所采用的預處理方法的流程圖;
圖4所示為本發明所采用的Hessian正則處理的流程圖;
圖5所示為本發明所采用的相互投影及迭代過程的流程圖。
具體實施方式
下面將結合附圖對本發明進行詳細說明。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東省科學院情報研究所,未經山東省科學院情報研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611204912.6/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





