[發明專利]基于譜圖分析的圖像集合的場景分類方法及裝置有效
| 申請號: | 201110221407.3 | 申請日: | 2011-08-03 |
| 公開(公告)號: | CN102542285A | 公開(公告)日: | 2012-07-04 |
| 發明(設計)人: | 戴瓊海;錢彥君 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 張大威 |
| 地址: | 100084 北京*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分析 圖像 集合 場景 分類 方法 裝置 | ||
技術領域
本發明涉及計算機視覺技術領域,特別涉及一種基于譜圖分析的圖像集合的場景分類方法及裝置。?
背景技術
場景分類的目標是得到輸入圖像的符合人類普遍認知的宏觀語義信息,是計算機視覺中的圖像理解技術的重要組成內容。它需要建立底層圖像視覺特征(如顏色、邊緣、紋理等)和高層場景語義概念的聯系,得到一些基本的場景類別信息(如森林、城市、海岸、天空、室內等等)。隨著數字圖像獲取技術的不斷發展,圖像數據庫的內容越來越龐大,傳統的人工手工標注變得越來越困難,所以利用計算機自動標注符合人類認知的語義信息就成為了研究的焦點。它不僅表示了人們對圖像的整體認識,而且也能為圖像中的目標識別提供環境,從而提高算法的準確率。?
近幾年來,在文本識別中的特征包(bag-of-features)的方法被引入到場景分類中,取得了重要的研究成果,并成為了主流技術。現有基于特征包的場景分類方法的缺點在于碼字分配中,只利用每個SIFT特征和碼字的歐式距離來確定它們之間的隸屬度。而它們均為分布是分布在高維(128維)上的數據,直接使用歐式距離會丟失大量的非線性信息,從而降低分類的效果。?
發明內容
本發明旨在至少解決上述技術問題之一。?
為此,本發明的一個目的在于提出一種基于譜圖分析的圖像集合的場景分類方法。該方法通過譜圖分析最終確定的隸屬度更加精確,避免非線性數據的丟失,進而提高分類結果的準確性。?
本發明的另一目的在于提出一種基于譜圖分析的圖像集合的場景分類裝置。?
為了實現上述目的,本發明第一方面實施例提出的基于譜圖分析的圖像集合的場景分類方法,包括以下步驟:A:提取所述圖像集合中的SIFT特征集合,并得到所述SIFT特征集合的K個聚類和K個碼字,其中,所述K任意整數,所述SIFT特征集合中SIFT特征的個數為N;B:根據所述SIFT特征集合中任意圖像的SIFT特征和所述K個碼字建立所述任意圖像的有權譜圖G=(V,E),其中,所述V為由所述任意圖像的全部SIFT特征和每個所述碼字組成的節點集合,E為相鄰的所述每兩個節點連線所組成的邊的集合,其中,所述任意圖像的全部SIFT特征的個數為N1,且N1小于或等于N;C:計算所述節點集合V中任意一節點與其它節點之間的歐氏距離,并根據所述歐式距離確定與所述任意一節點?的歐式距離最近的K’個節點,其中K’為預定閾值;D:根據全部所述任意一節點與所述任意一節點的歐氏距離最近的所述K’個節點得到所述節點集合V對應的權重矩陣W,其中權重矩陣W的行數和列數均為所述節點集合V的節點個數N;E:根據所述權重矩陣W獲得所述有權譜圖G的散度算子對角矩陣D;F:根據所述權重矩陣W和所述散度算子對角矩陣D得到拉普拉斯算子矩陣L;G:基于隨機游走模型對所述拉普拉斯算子矩陣L進行運算以得到所述任意圖像的每一個SIFT特征與所述K個碼字的每一個碼字之間的交互時間,并根據所述交互時間確定所述每一個SIFT特征與所述K個碼字之間的隸屬度;以及H:根據所述隸屬度確定碼字分配結果,并根據所述分配結果對所述任意圖像中的場景進行分類。?
根據本發明實施例的基于譜圖分析的圖像集合的場景分類方法,通過建立圖像的有權譜圖,并對有權譜圖譜進行分析,然后計算SIFT特征和碼字在譜圖上基于隨機游走模型的交互時間,并根據交互時間確定SIFT特征和碼字之間的相似度,接著通過SIFT特征和碼字之間的相似度得到SIFT特征關于每個碼字的隸屬度,該方法充分利用SIFT特征和碼字分布在高維空間上的流性特征計算隸屬度,從而避免了直接通過SIFT特征和碼字之間的歐氏距離計算得到兩者之間的隸屬度所帶來的丟失大量的非線性數據,導致隸屬度不準確的發生。進而提高場景分類的準確性。?
另外,根據本發明的基于譜圖分析的圖像集合的場景分類方法還可以具有如下附加的技術特征:?
在本發明的一個實施例中,所述步驟A進一步包括:提取所述圖像的SIFT特征集合,并根據K-means算法對所述SIFT特征集合進行聚類以得到K個聚類和K個碼字,其中,所述K為(0,N)之間的預定整數,N為所述SIFT特征集合中SIFT特征的個數,所述K個碼字為所述K個聚類對應的K個聚類中心。?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110221407.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





