[發明專利]潛在狄利克雷模型的多尺度字典自然場景圖像分類方法在審
| 申請號: | 201310306975.2 | 申請日: | 2013-07-20 |
| 公開(公告)號: | CN103390046A | 公開(公告)日: | 2013-11-13 |
| 發明(設計)人: | 王爽;焦李成;張雪;牛振興;馬文萍;馬晶晶;陳陽平 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06K9/62 |
| 代理公司: | 陜西電子工業專利中心 61205 | 代理人: | 王品華;朱紅星 |
| 地址: | 710071*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 潛在 狄利克雷 模型 尺度 字典 自然 場景 圖像 分類 方法 | ||
技術領域
本發明屬于圖像處理技術領域,特別涉及自然場景圖像分類的方法,可用于目標識別、檢測、智能車輛及機器人導航。
背景技術
在過去的十年里,自然場景圖像分類已經成為圖像處理技術領域里一個很重要的研究主體。自然場景圖像分類有很廣泛的應用,如目標識別與檢測和智能車輛或機器人導航等領域。由于自然場景圖像類內差異性、照明條件差異性和圖像本身尺度差異性較大,使其仍然是具有挑戰性的問題。
自然場景圖像分類的分類方法大致可以分為兩類:一類是基于低層語義模型的自然場景圖像分類方法;一類是基于中層語義模型的自然場景圖像分類方法。早期的一些自然場景圖像分類方法大多數是應用低層信息建立模型的,這些方法采用全局統計信息,如運用全局的顏色或者紋理特征直方圖表示圖像。盡管這些方法的時間復雜性較低,但是它們通常應用于人為場景圖像和室內場景圖像分類,并且分類結果較差。近期關于自然場景圖像分類的方法都是基于中層語義模型的,它們彌補了高層語義信息和低層語義信息之間的鴻溝,并解決層次分類定義重疊問題,因此得到了廣泛應用。
Oliva和Torralba使用一組視覺感知屬性來描述場景的主要空間結構,他們定義了自然度、寬闊度、粗糙度、伸展度和險峻度等視覺感知屬性,通過底層特征來得到這些視覺感知屬性。Vogel等人則首先將局部圖像區域分類到一定的語義概念中,然后根據這些語義概念在圖像中出現的頻率描述圖像。但這些方法中為了得到預定義的語義概念模型,往往需要大量的人工標記樣本。為了減少生成中間語義所需的人工標記工作,一些采用文本主題模型的方法被用于自然場景圖像分類,這些方法主要以Lifeifei和Quelhas等人提出的自然場景圖像分類方法為代表。這些方法通常先提取圖像中的尺度不變特征,然后將圖像的尺度不變特征通過聚類生成一個字典來表示聚類中心,然后通過字典映射得到一個表示圖像的稀疏表示向量,最后應用文本分類中的概率潛在語義分析方法和潛在狄利克雷模型等主題分析方法來找出圖像的潛在語義主題分布,從而完成圖像的場景分類。這類方法雖然很大地減少對人工標記的需求,但是它們通常是根據圖像中視覺詞匯出現的總體情況來進行場景分類的,由于沒有考慮詞匯之間的尺度關系和語義關系,因此往往不能得到好的分類結果。
發明內容
本發明的目的在于針對上述已有方法的不足,提出一種潛在狄利克雷模型的多尺度字典自然場景圖像分類方法,以減少人工標記的需求,豐富圖像特征的尺度信息,提高分類正確率。
為實現上述目的,本發明的技術方案包括如下步驟:
(1)分別建立自然場景圖像分類訓練集和圖像分類測試集;
(2)提取訓練集中每幅圖像采樣點尺度不變特征集合F,生成多尺度字典D:
(2a)用網格采樣方法對訓練集中的每幅圖像進行網格采樣,得到每幅圖像的網格采樣點SP;
(2b)用尺度不變特征提取方法對訓練集中每幅圖像的網格采樣點SP提取尺度不變特征,得到訓練集中每幅圖像的尺度不變特征集合F;
(2c)用K均值聚類算法分別對訓練集上每幅圖像網格采樣點的尺度不變特征F進行聚類,生成字典D;
(3)用多尺度字典D對訓練集中每幅圖像進行字典映射詞袋模型BOW描述,得到每幅圖像對應的多尺度稀疏表示向量W;
(4)用Gibbs采樣方法估計潛在狄利克雷模型中的隱參數,得到訓練集中每幅圖像的潛在語義主題模型Z和潛在語義主題分布θ;
(5)用圖像潛在語義主題模型Z生成測試集中每幅圖像潛在語義主題分布θ1;
(6)將訓練集中每幅圖像的潛在語義主題分布θ和其對應的類別l作為訓練數據,用支撐向量機SVM算法獲得自然場景分類模型E;
(7)根據自然場景分類模型E對測試圖像進行分類。
本發明與現有的技術相比具有以下優點:
1、本發明通過步驟(2)提取訓練集中每幅圖像采樣點尺度不變特征集合F,生成多尺度字典D,豐富了每幅圖像特征的尺度信息,因此與Lifeifei和Quelhas等人的方法相比,正確率有著很大的提高。
2、本發明由于只需要將整幅圖像進行標記,就可以完成自然圖像場景分類的過程,與Vogel等人需要將局部圖像區域和整幅圖像均進行標記的方法相比,大大減少了人工標記的工作量,自動化程度更高。
附圖說明
圖1是本發明的實現流程圖;
圖2是本發明仿真采用的國際標準場景圖像類別庫中的樣例圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310306975.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:心臟外科手術中一種新型的心尖部探查裝置
- 下一篇:扇形皂盒





