[發(fā)明專利]一種基于有監(jiān)督學(xué)習(xí)概率主題模型的地點(diǎn)圖像識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201410064526.6 | 申請(qǐng)日: | 2014-02-25 |
| 公開(公告)號(hào): | CN103810500B | 公開(公告)日: | 2017-04-05 |
| 發(fā)明(設(shè)計(jì))人: | 楊金福;解濤;趙偉偉;李明愛;高晶鈺;張濟(jì)昭 | 申請(qǐng)(專利權(quán))人: | 北京工業(yè)大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06K9/46 |
| 代理公司: | 北京思海天達(dá)知識(shí)產(chǎn)權(quán)代理有限公司11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 監(jiān)督 學(xué)習(xí) 概率 主題 模型 地點(diǎn) 圖像 識(shí)別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于模式識(shí)別領(lǐng)域,涉及一種利用概率主題模型進(jìn)行圖像識(shí)別方法,尤其是一種基于有監(jiān)督學(xué)習(xí)概率主題模型的地點(diǎn)圖像識(shí)別方法,用于提高地點(diǎn)圖像的識(shí)別率。
背景技術(shù)
目前,隨著人工智能的發(fā)展,移動(dòng)智能機(jī)器人被廣泛地應(yīng)用于工業(yè)、軍事和服務(wù)等領(lǐng)域,發(fā)揮著越來越重要的作用。智能機(jī)器人認(rèn)知環(huán)境的能力越來越重要。機(jī)器人只有在知道自身位置和工作環(huán)境,才能安全有效地進(jìn)行自主運(yùn)動(dòng),為人們提供更好的服務(wù)。因此,認(rèn)知環(huán)境和位置估計(jì)成為智能移動(dòng)機(jī)器人最重要的能力之一。視覺系統(tǒng)能夠?yàn)闄C(jī)器人提供最豐富的感知信息,同時(shí)也最接近人類感知環(huán)境的方式。近年來,基于視覺的機(jī)器人自定位問題吸引了大量的研究人員,同時(shí)也取得了豐碩的研究成果。
根據(jù)機(jī)器人定位使用的視覺特征信息的不同,基于視覺的機(jī)器人自定位方法主要包括以下三種:基于地標(biāo)特征的自定位方法,基于圖像外觀特征的自定位方法,以及基于地點(diǎn)識(shí)別的自定位方法。其中,基于地點(diǎn)識(shí)別的自定位方法,使用了人們可以直接理解的語義信息,如“道路”、“雕塑”、“走廊”等,作為視覺特征信息,實(shí)現(xiàn)一種全局的拓?fù)涠ㄎ唬瑯?gòu)建拓?fù)涞貓D,用于機(jī)器人路徑規(guī)劃和人機(jī)交互等應(yīng)用場合。然而,要實(shí)現(xiàn)基于地點(diǎn)識(shí)別的自定位方法,必須圖像進(jìn)行語義表示。為了解決上述問題,引入基于概率主題模型的圖像識(shí)別方法。
概率主題模型是機(jī)器學(xué)習(xí)領(lǐng)域中結(jié)合統(tǒng)計(jì)理論和圖論算法的一種模型,它提供了一種建模方法,對(duì)實(shí)際問題進(jìn)行概率建模,將實(shí)際問題用潛在的語義主題進(jìn)行描述,對(duì)解決實(shí)際問題的不確定性具有一定作用。概率主題模型最初應(yīng)用在自然語言處理和文本分類領(lǐng)域,并取得了很好的應(yīng)用效果,后來逐漸引入到機(jī)器視覺領(lǐng)域中。2005年,李菲菲等在論文“A?Bayesian?hierarchical?model?for?learning?natural?scene?categories”中,使用度不變特征提取算法(Scale-Invariant?Features,SIFT)特征檢測子和描述子提取局部特征,并使用潛在狄利克雷分布(Latent?Dirichlet?Distribution,LDA)的概率主題模型生成的包含語義信息的主題對(duì)圖像進(jìn)行描述,最后用貝葉斯分類器對(duì)圖像進(jìn)行分類,從而實(shí)現(xiàn)基于局部特征的地點(diǎn)識(shí)別。該方法通過LDA模型對(duì)圖像進(jìn)行語義描述,并對(duì)影響圖像識(shí)別的不確定性因素起到一定作用,使用了人們可以直接理解的語義信息,其不足是當(dāng)LDA模型中主題數(shù)超過40時(shí)圖像的識(shí)別率會(huì)出現(xiàn)過擬合。2010年,David?M.Blei等在論文“Supervised?Topic?Model”中,通過sLDA(supervised?latent?Dirichlet?allocation)對(duì)有標(biāo)簽的文檔進(jìn)行建模,然后使用mean-filed?variational方法對(duì)sLDA模型的參數(shù)進(jìn)行估計(jì),從而達(dá)到對(duì)文檔內(nèi)容的預(yù)測。此文中的sLDA模型與LDA模型相比較,不僅可以用于分類,還可以用于預(yù)測,而且識(shí)別率和預(yù)測的準(zhǔn)確性都比較高;同時(shí)可以解決LDA模型中主題數(shù)目增加時(shí)出現(xiàn)的識(shí)別率過擬合現(xiàn)象。但是,此文中的sLDA模型用于文本文檔中,未被用于地點(diǎn)圖像識(shí)別中。
綜上所述,現(xiàn)有技術(shù)在基于地點(diǎn)識(shí)別的機(jī)器人自定位方法中存在以下問題:機(jī)器人實(shí)際獲得的圖像常會(huì)受到光照變化和拍攝視角以及場景混亂和事物動(dòng)態(tài)變化等影響,這些固有的、可變的影響使得地點(diǎn)識(shí)別過程充滿了不確定性;LDA模型中隨著主題數(shù)目的增加圖像的識(shí)別率會(huì)出現(xiàn)過擬合現(xiàn)象,進(jìn)而影響圖像的識(shí)別效果;sLDA模型可以解決隨著主題數(shù)目增加出現(xiàn)的識(shí)別率過擬合現(xiàn)象,但是未被應(yīng)用到基于概率主題模型的地點(diǎn)圖像識(shí)別系統(tǒng)中。
發(fā)明內(nèi)容
針對(duì)現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明提出一種基于有監(jiān)督學(xué)習(xí)概率主題模型的地點(diǎn)識(shí)別方法,解決地點(diǎn)識(shí)別過程中由于拍攝角度和光照的不同,以及圖像中物體變化所導(dǎo)致的不確定性問題;通過sLDA模型對(duì)地點(diǎn)圖像信息進(jìn)行建模,有效提高地點(diǎn)圖像的識(shí)別率。
為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案是:提供一種基于有監(jiān)督學(xué)習(xí)概率主題模型的地點(diǎn)識(shí)別方法,通過mean-filed?variational算法對(duì)有監(jiān)督概率主題模型的參數(shù)進(jìn)行學(xué)習(xí),用潛在主題對(duì)圖像進(jìn)行語義描述,然后根據(jù)sLDA模型中響應(yīng)變量的值對(duì)圖像進(jìn)行分類,進(jìn)而達(dá)到圖像識(shí)別目的。
一種基于有監(jiān)督學(xué)習(xí)概率主題模型的地點(diǎn)圖像識(shí)別方法,包括以下步驟:
步驟1,通過安裝在機(jī)器人上的標(biāo)準(zhǔn)攝像頭獲取訓(xùn)練圖像集和測試圖像集。
圖像包含光照、視角、尺度的變化以及人物和物體的動(dòng)態(tài)變化。
步驟2,圖像預(yù)處理,將獲取的圖像灰度化。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京工業(yè)大學(xué),未經(jīng)北京工業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410064526.6/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對(duì)象尋址方法、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測方法及系統(tǒng)





