[發(fā)明專利]基于主題模型方法和領(lǐng)域規(guī)則庫實現(xiàn)場景分析描述的方法有效
| 申請?zhí)枺?/td> | 201410057882.5 | 申請日: | 2014-02-20 |
| 公開(公告)號: | CN103778443B | 公開(公告)日: | 2017-05-03 |
| 發(fā)明(設(shè)計)人: | 何瑩;王建;譚懿先;梅林;吳軼軒;杜歡;尚巖峰;王文斐;鐘雪霞 | 申請(專利權(quán))人: | 公安部第三研究所 |
| 主分類號: | G06K9/64 | 分類號: | G06K9/64;G06F17/30;G06F17/27 |
| 代理公司: | 上海智信專利代理有限公司31002 | 代理人: | 王潔,鄭暄 |
| 地址: | 200031*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 主題 模型 方法 領(lǐng)域 規(guī)則 實現(xiàn) 場景 分析 描述 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及計算機視覺分析與智能理解技術(shù)領(lǐng)域,尤其涉及基于主題模型方法和領(lǐng)域規(guī)則庫對圖像場景進行描述和高層理解領(lǐng)域,具體是指一種基于主題模型方法和領(lǐng)域規(guī)則庫實現(xiàn)場景分析描述的方法。
背景技術(shù)
場景分類作為計算機視覺領(lǐng)域中圖像分析理解技術(shù)的重要組成部分,其目標(biāo)在于基于輸入圖像得到符合人類普遍認知的宏觀語義信息。圖像分類即是建立底層視覺特征(如顏色、邊緣、紋理等)與高層語義概念之間的聯(lián)系,最終得到場景的類別描述信息,如森林、海岸、籃球場等。目前,常見的場景分類方法有兩種,分別為基于圖像底層特征的方法和通過構(gòu)建中間語義層的方法。所謂基于圖像底層特征的方法,是利用圖像的底層特征,如顏色、紋理和邊緣特征等,將圖像作為一個整體,應(yīng)用監(jiān)督學(xué)習(xí)方法,對場景進行分類,如室內(nèi)/室外、森林/街道等場景圖像,然而,該類方法只能對小部分的場景進行分類,有一定的局限性。此外,該類方法存在的另外一個主要問題為,底層物理特征通常只能反映圖像在物理感知層面的特點,而非人們所關(guān)注的認知層面的理解。第二種方法通過構(gòu)建中間語義層,能夠?qū)崿F(xiàn)更多場景類別的識別,如引入文本分析中的概率隱含語義分析模型,建立圖像模型。然而這類方法僅僅是對場景進行了分類,沒有涉及到對場景的分析,以及興趣度事件的挖掘,而本發(fā)明即是在另外一種主題模型方法狄利克雷分布的基礎(chǔ)上,引入領(lǐng)域知識庫,除了進行場景分類外,亦對場景中存在的典型興趣度事件進行挖掘。從對視覺理解的角度看,場景的分析和描述和場景中包含的對象有著極大的關(guān)系,如場景中存在人、足球、網(wǎng),則最有可能的場景是足球場。
吳玲達等在其申請的發(fā)明專利“一種基于區(qū)域潛在語義特征的自然場景圖像分類方法”[200810031577.3]中公開了一種基于區(qū)域潛在語義特征的自然場景分類方法。利用圖像的區(qū)域潛在語義信息和該信息在空間的分布規(guī)律來進行自然場景圖像分類。提出的方法引入了區(qū)域潛在語義特征,不僅描述了圖像分塊的區(qū)域信息,而且還對分塊在空間的分布信息進行了描述,該方法可以得到較高的準(zhǔn)確率,且不需要人工標(biāo)注,自動化程度高。
戴瓊海等在其申請的發(fā)明專利“基于譜圖聚類分析的圖像集合的場景分類方法及裝置”[201110221407.3]中公開了一種基于譜圖分析的圖像結(jié)合的場景分類方法及裝置,該方法通過交互時間確定的隸屬度更加精確,避免非線性數(shù)據(jù)的丟失,進而提高分類結(jié)果的準(zhǔn)確性,同時,該發(fā)明的裝置結(jié)構(gòu)簡單,易于實現(xiàn)。
金標(biāo)等在其申請的發(fā)明專利“一種基于目標(biāo)及其空間關(guān)系特性的圖像場景分類方法”[201110214985.4]中公開了一種基于目標(biāo)及其空間關(guān)系特性的圖像場景分類方法,通過計算圖像中目標(biāo)之間的空間關(guān)系直方圖,分類其空間關(guān)系,建立融合主題之間空間關(guān)系特性的概率隱含語義分析模型,最后,采用支持向量機方法對場景進行分類。該方法彌補了現(xiàn)有圖像場景分類方法忽視圖像中目標(biāo)之間空間關(guān)系特性的缺陷,有效地提高了分類準(zhǔn)確率。
綜上可知,上述專利均從場景分類角度對圖像進行了處理,對于圖像中存在的對象和圖像表述含義之間的關(guān)系未進行關(guān)注,對圖像所蘊含潛在的語義信息未能進行深度及有效挖掘。
發(fā)明內(nèi)容
本發(fā)明的目的是克服了上述現(xiàn)有技術(shù)的缺點,提供了一種能夠?qū)崿F(xiàn)基于主題模型對場景進行分類的基礎(chǔ)上引入領(lǐng)域規(guī)則庫對場景進行潛在語義信息的挖掘、對興趣度事件進行挖掘描述、具有良好的目的導(dǎo)向性和擴展性、簡單有效、適用于大規(guī)模推廣應(yīng)用的基于主題模型方法和領(lǐng)域規(guī)則庫實現(xiàn)場景分析描述的方法。
為了實現(xiàn)上述目的,本發(fā)明的基于主題模型方法和領(lǐng)域規(guī)則庫實現(xiàn)場景分析描述的方法具有如下構(gòu)成:
該基于主題模型方法和領(lǐng)域規(guī)則庫實現(xiàn)場景分析描述的方法,其主要特點是,所述的方法包括以下步驟:
(1)獲取訓(xùn)練視頻圖像并采用對象分類器對訓(xùn)練視頻圖像進行訓(xùn)練得到滴狀對象容器和紋理對象容器;
(2)將所述的滴狀對象容器和紋理對象容器進行融合并對融合的對象容器進行分析得到語義主題模型;
(3)獲取測試視頻圖像并根據(jù)所述的語義主題模型對所述的測試視頻圖像進行場景分類得到場景分類結(jié)果;
(4)根據(jù)所述的語義主題模型的場景分類結(jié)果和基于先驗知識建立的領(lǐng)域規(guī)則庫對所述的測試視頻圖像進行場景語義理解描述。
較佳地,所述的采用對象分類器對訓(xùn)練視頻圖像進行訓(xùn)練得到滴狀對象容器和紋理對象容器,包括以下步驟:
(11)對所述的訓(xùn)練視頻圖像采用尺度不變特征轉(zhuǎn)換特征提取方法進行處理得到特征矩陣;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于公安部第三研究所,未經(jīng)公安部第三研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410057882.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





