[發明專利]圖像分類方法及圖像分類裝置有效
| 申請號: | 200910135930.7 | 申請日: | 2009-04-30 |
| 公開(公告)號: | CN101877064A | 公開(公告)日: | 2010-11-03 |
| 發明(設計)人: | 吳偉國;路紅;薛向陽 | 申請(專利權)人: | 索尼株式會社;復旦大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 朱勝;李春暉 |
| 地址: | 日本*** | 國省代碼: | 日本;JP |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 分類 方法 裝置 | ||
技術領域
本發明一般地涉及模式識別和多媒體技術領域,特別涉及一種圖像分類方法及圖像分類裝置。
背景技術
隨著多媒體技術的發展和因特網的普及,人們獲得各種多媒體信息越來越容易,其中圖像是數量最多的一種,如何對圖像進行分類或標注以便有效地、快速地從大規模圖像數據庫中檢索出所需要的圖像已成為人們日益關注的問題。
一種傳統的做法是通過關鍵字對圖像進行人工標注。然而,該方法是極其費時的,并且不同的人可能產生不同的標注結果,例如,包含菊花的圖像可能被標注為“菊花”或“黃色花”。
為了克服人工標注的限制,例如,在T.Kato所著的“Databasearchitecture?for?content-based?image?retrieval”(Image?Storage?and?RetrievalSystems,Proc.SPIE,1662:112-123,1992)一文中公開了一種基于內容的圖像檢索技術(CBIR),其中提取圖像的諸如顏色,紋理,形狀等低層視覺特征來推斷圖像的高層語義。然而,由于圖像的低層視覺特征與圖像的語義表達之間存在“語義鴻溝”,因此傳統的CBIR技術不能滿足人們按語義對圖像進行分類和檢索的需求。
對于圖像語義信息的提取,上下文關系信息是重要的。具體地說,以對象“老虎”的概念為例,其通常都出現在具有諸如“天空”、“草地”等背景對象的自然風景中。這樣,為了改善圖像分類和檢索性能,一種趨勢是在從圖像中提取語義概念時既考慮圖像的內容信息也考慮其上下文關系信息。例如,在J.Luo等人所著的“Pictures?are?not?taken?in?a?vacuum-an?overviewof?exploiting?context?for?semantic?scene?content?understanding”(IEEE?SignalProcessing?Magazine,23(2):101-114,March?2006)一文中公開了在進行用戶照片理解時考慮了時間上下文關系和空間上下文關系等。具體地說,基于區域劃分結果對空間上下文關系進行建模,并且考慮了區域之間的諸如“上”、“下”等七種空間關系。另外,針對“天空”、“草地”、“樹葉”等六個概念的每個空間上下文關系對條件概率矩陣進行訓練。實驗結果顯示了通過考慮空間上下文關系,提高了圖像分類性能。但是,由于該空間關系是顯式定義的,因此增加了對分類器進行訓練所需的人工量,并且限制了該方案的應用范圍。
發明內容
在下文中給出了關于本發明的簡要概述,以便提供關于本發明的某些方面的基本理解。但是,應當理解,這個概述并不是關于本發明的窮舉性概述。它并不是意圖用來確定本發明的關鍵性部分或重要部分,也不是意圖用來限定本發明的范圍。其目的僅僅是以簡化的形式給出關于本發明的某些概念,以此作為稍后給出的更詳細描述的前序。
鑒于現有技術的上述情形,本發明的目的是提供一種新穎的圖像分類方法,其可以有效地利用圖像的上下文關系信息來進行圖像分類而無需顯式定義圖像中對象之間的空間關系,從而提高了圖像分類性能。
為了實現上述目的,根據本發明的一個方面,提供了一種圖像分類方法,包括以下步驟:圖像分割步驟,將輸入的圖像分割為多個區域;特征提取步驟,提取每個區域的視覺特征;第一分類步驟,對于每個區域,根據所提取的所述區域的視覺特征,利用第一分類器,按照預定的多個類別對所述區域進行多類分類;上下文關系特征生成步驟,根據每個區域的分類結果來生成所述圖像的上下文關系特征;以及第二分類步驟,根據所生成的所述圖像的上下文關系特征,利用第二分類器,確定所述圖像所屬的類別。
根據本發明的另一個方面,還提供了一種圖像分類裝置,其包括:圖像分割單元,其被配置成將輸入的圖像分割為多個區域;特征提取單元,其被配置成提取每個區域的視覺特征;第一分類單元,其被配置成對于每個區域,根據所提取的所述區域的視覺特征,利用第一分類器,按照預定的多個類別對所述區域進行多類分類;上下文關系特征生成單元,其被配置成根據每個區域的分類結果來生成所述圖像的上下文關系特征;以及第二分類單元,其被配置成根據所生成的所述圖像的上下文關系特征,利用第二分類器,確定所述圖像所屬的類別。
根據本發明的另一個方面,還提供了用于實現上述圖像分類方法的計算機程序產品。
根據本發明的另一個方面,還提供了計算機可讀介質,其上記錄有用于實現上述圖像分類方法的計算機程序代碼。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于索尼株式會社;復旦大學,未經索尼株式會社;復旦大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910135930.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:使用真空夾具的爐內釬焊方法
- 下一篇:集成電路的制造方法
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





