[發(fā)明專利]一種基于目標及其空間關(guān)系特性的圖像場景分類方法無效
| 申請?zhí)枺?/td> | 201110214985.4 | 申請日: | 2011-07-29 |
| 公開(公告)號: | CN102902976A | 公開(公告)日: | 2013-01-30 |
| 發(fā)明(設(shè)計)人: | 金標;胡文龍;付琨 | 申請(專利權(quán))人: | 中國科學院電子學研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/66 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 周國城 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 目標 及其 空間 關(guān)系 特性 圖像 場景 分類 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于圖像場景分類技術(shù),涉及圖像理解、計算機視覺、人工智能、模式識別等領(lǐng)域,是一種基于目標及其空間關(guān)系特性的圖像場景分類方法。
背景技術(shù)
隨著多媒體技術(shù)與網(wǎng)絡(luò)技術(shù)的發(fā)展,產(chǎn)生了大量的圖像信息,圖像分類和檢索越來越受到人們的關(guān)注。同時隨著計算機技術(shù)的快速提高,圖像理解獲得了快速發(fā)展,其理論不斷發(fā)展,形成了與計算機視覺、人工智能和認知學領(lǐng)域相互關(guān)聯(lián)又相互獨立的領(lǐng)域。圖像理解就是對圖像的語義解釋,利用圖像低層視覺特征以及高層知識信息實現(xiàn)目標識別、語義分析以及場景分類。圖像場景分類作為圖像理解的基本任務(wù)之一,是指從多幅圖像中區(qū)分出具有相似或相同特征的圖像,并對這些圖像進行正確標記的過程。
目前場景分類方法主要包括基于圖像底層特征的方法,以及通過構(gòu)建中間語義層的方法。第一種方法利用圖像的底層特征,如顏色、紋理、邊緣等,將圖像作為一個整體并直接與監(jiān)督方法結(jié)合,劃分如室內(nèi)/外、城市/山區(qū)等場景圖像,該類方法只能分類小部分場景。第二種方法通過構(gòu)建中間語義層,能夠?qū)崿F(xiàn)更多場景類別的識別,如引入文本分析中的概率隱含語義分析模型(Probabilistic?latent?semantic?analysis,pLSA),建立圖像模型(文獻1:A.Bosch?and?A.Zisserman,“Scene?classification?using?a?hybrid?generative/discriminative?approach”,IEEE?Transactions?on?Pattern?Analysis?and?Machine?Intelligence,v.30no.4,pp.712-727,2008);再如基于圖像目標或區(qū)域建立貝葉斯模型實現(xiàn)圖像場景分類(文獻2:M.R.Boutell,J.Luo?and?C.M.Brown,“Scene?parsing?using?region-based?generative?models”,IEEE?Transactions?on?Multimedia,v.9?no.a,pp.136-146,2007)。另外,Oliva提出使用粗糙度、寬闊度、伸展度等視覺感知屬性描述場景的主要內(nèi)容結(jié)構(gòu)(文獻3:A.Oliva?and?A.Torralba,“Modeling?the?shape?of?the?scene:a?holistic?representation?of?the?spatial?envelope”,International?Journal?of?Computer?Vision,v.42?n.3,pp.145-175,2001),基于以上特征實現(xiàn)圖像場景分類。
場景圖像具有很強的認知結(jié)構(gòu),蘊含場景與目標的包含關(guān)系,以及目標之間的空間關(guān)系特性。文獻1證明了加入空間位置信息可以提高分類正確率,但是該空間信息是絕對的位置特征,至今沒有通過建模目標之間的空間關(guān)系(拓撲關(guān)系、方向關(guān)系以及度量關(guān)系)實現(xiàn)圖像場景分類。
發(fā)明內(nèi)容
本發(fā)明的目的是公開一種基于目標及其空間關(guān)系特性的圖像場景分類方法,通過計算圖像中目標之間的空間關(guān)系直方圖,分類其空間關(guān)系,建立融合主題之間空間關(guān)系特性的概率隱含語義分析模型(Probabilistic?latent?semantic?analysis?fusing?spatial?relationships?between?topics,SR-pLSA),最后采用支持向量機(Support?vector?support,SVM)分類圖像場景。彌補了現(xiàn)有圖像場景分類方法忽略圖像中目標間空間關(guān)系特性的缺陷,提高了分類正確率。
為了實現(xiàn)所述的目的,本發(fā)明的技術(shù)解決方案是:
一種基于目標及其空間關(guān)系特性的圖像場景分類方法,其包括:
步驟S1,目標空間關(guān)系直方圖計算:用空間關(guān)系直方圖表征目標間空間關(guān)系特性,包括左和右、上和下、遠和近以及包含和不包含,并給出計算方法;
步驟S2,空間關(guān)系分類:針對樣本圖像,標注其目標并賦值目標之間空間關(guān)系的隸屬度,針對測試樣本,用模糊K近鄰分類器分類目標之間空間關(guān)系直方圖,計算其空間關(guān)系的隸屬度值;
步驟S3,SR-pLSA建模:提出融合主題之間空間關(guān)系特性的概率隱含語義分析模型SR-pLSA,建立圖像語義模型;
步驟S4,SVM分類:以步驟S3建立樣本圖像的語義模型,作為支持向量機(SVM)的輸入,用訓練好的SVM完成圖像場景的分類。
所述的圖像場景分類方法,其所述步驟S1中,目標空間關(guān)系直方圖計算包括步驟:
步驟S11:分別求取參考對象以及目標對象區(qū)域的點集;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院電子學研究所,未經(jīng)中國科學院電子學研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110214985.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





