[發明專利]一種基于區域潛在語義特征的自然場景圖像分類方法無效
| 申請號: | 200810031577.3 | 申請日: | 2008-06-25 |
| 公開(公告)號: | CN101315663A | 公開(公告)日: | 2008-12-03 |
| 發明(設計)人: | 吳玲達;謝毓湘;曾璞;楊征;欒悉道;文軍;陳丹雯 | 申請(專利權)人: | 中國人民解放軍國防科學技術大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06F17/30 |
| 代理公司: | 國防科技大學專利服務中心 | 代理人: | 郭敏 |
| 地址: | 410073湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 區域 潛在 語義 特征 自然 場景 圖像 分類 方法 | ||
技術領域
本發明涉及多媒體信息處理技術領域里關于圖像分類的方法,尤其是一種通過提取圖像的區域潛在語義特征來實現對自然場景圖像進行分類的方法,是一種綜合考慮了圖像區域所包含的信息以及這些區域信息在圖像的空間分布來進行自然場景圖像分類的方法。
背景技術
互聯網的快速發展、信息存儲與傳輸技術的發展以及數碼設備的普及帶來圖像數據的爆炸性增長,這就對如何進行大量圖像數據的檢索與瀏覽提出了新的技術挑戰。面對數量如此巨大的圖像數據,傳統的依靠人工來對圖像進行分類的管理方式因為需要耗費大量的人力資源而變得不可行。因此,如何利用計算機將圖像自動分類到一些預定義的類別中就成為其中的一個關鍵問題。由于自然場景圖像在人們的日常生活中十分常見,數量也十分巨大,因此對于自然場景圖像的分類問題的研究就成為了當前計算機視覺和多媒體信息管理領域的一個熱點問題。
傳統的自然場景圖像分類方法通常使用色彩、紋理和形狀等圖像底層物理特征來直接與各種分類方法相結合,從而實現對圖像的分類。采用底層物理特征的一個主要問題在于底層物理特征往往只反映圖像在物理感知層次上的特點,而不是人們所關注的認知層面的內容。近年來,為了克服底層物理特征與人類認知語義之間的鴻溝,使用中間語義特征來對自然場景建模的方法得到了廣泛的關注。Oliva和Torralba使用一組視覺感知屬性來描述場景的主要空間結構,他們定義了自然度、寬闊度、粗糙度、伸展度和險峻度等視覺感知屬性,通過分析底層特征來得到這些視覺感知屬性。Vogel等人則首先將局部圖像區域分類到一些預定義的語義概念中,然后根據這些語義概念在圖像中出現的頻率來描述圖像。但在這些方法中,為了得到預定義的語義概念模型,往往需要大量的人工標注樣本。為了減少生成中間語義所需的人工標注工作,一些采用文本主題模型的方法被用于圖像場景分類,這些方法主要以Lifeifei、Quelhas以及Bosch提出的方法為代表。這些方法通常先提取圖像中的尺度不變特征(Scale?Invariant?Feature?Transform,SIFT),然后將圖像的SIFT特征通過聚類生成一個視覺詞匯表來表示聚類中心。在生成了視覺詞匯表后將圖像中的SIFT特征映射成一個個的視覺詞匯,從而采用文本中最常見的詞袋特征(Bag?of?Word,BOW)來表示圖像,最后應用文本分類中的概率潛在語義分析方法(Probabilistic?Latent?Semantic?Analysis,PLSA)和潛在Dirichlet分析方法(LatentDirichlet?Analysis,LDA)等主題分析方法來找出圖像最可能屬于的主題或者潛在語義,從而完成圖像的場景分類。這類方法能夠很大地減少對人工標注的需求,但是它們通常是根據圖像中視覺詞匯出現的總體情況來進行場景分類,它們既沒有考慮視覺詞匯在空間的分布特點,也無法利用圖像中區域語義構成的上下文信息來進行場景分類,因此在圖像視覺詞匯總體分布規律不顯著的情況下往往不能得到好的分類結果。
發明內容
本發明要解決的技術問題是如何綜合利用圖像區域所包含的潛在語義信息和這些區域包含的潛在語義信息在空間的分布規律來進行自然場景圖像分類。本發明提供一種基于區域潛在語義特征的自然場景圖像分類方法,首先通過對圖像進行空間金字塔分塊來生成圖像區域,然后使用概率潛在語義分析方法來得到區域潛在語義特征(即每個分塊區域包含每一個潛在語義的概率值),最后利用區域潛在語義特征來構建相應的分類器模型,從而將自然場景圖像自動分類到預定義的類別。本發明通過綜合利用圖像的區域語義信息和區域信息在圖像上的空間分布情況,提高了分類的準確性和智能性,減少了人工參與的程度,能夠滿足圖像管理和檢索的需求。
本發明的技術方案如下:
第一步,建立自然場景圖像分類代表集。方法是:
1.1、根據使用需要定義N個自然場景圖像類別,類別編號為1~N,N為自然數。
1.2、對每個自然場景圖像類別隨機選擇50-200幅圖像作為該類別的圖像分類代表。
1.3、將所有N類的自然場景圖像分類代表作為自然場景圖像分類代表集。
第二步,對自然場景圖像分類代表集中的圖像進行采樣點SIFT特征提取,生成通用視覺詞匯表。方法是:
2.1、對于自然場景圖像分類代表集中的每幅圖像采用網格采樣方法進行網格采樣,得到每幅圖像的網格采樣點SP,方法是:對輸入圖像Ig按M×M像素大小的網格進行采樣,其中M為2的整數次冪,建議M取8或16;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍國防科學技術大學,未經中國人民解放軍國防科學技術大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810031577.3/2.html,轉載請聲明來源鉆瓜專利網。





