[發明專利]一種基于有監督學習概率主題模型的地點圖像識別方法有效
| 申請號: | 201410064526.6 | 申請日: | 2014-02-25 |
| 公開(公告)號: | CN103810500B | 公開(公告)日: | 2017-04-05 |
| 發明(設計)人: | 楊金福;解濤;趙偉偉;李明愛;高晶鈺;張濟昭 | 申請(專利權)人: | 北京工業大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 北京思海天達知識產權代理有限公司11203 | 代理人: | 張慧 |
| 地址: | 100124 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 學習 概率 主題 模型 地點 圖像 識別 方法 | ||
1.一種基于有監督學習概率主題模型的地點圖像識別方法,其特征在于,通過采用sLDA模型代替LDA模型識別測試集中未知的地點圖像;所述方法包括以下步驟:
步驟1,通過安裝在機器人上的標準攝像頭獲取訓練圖像集和測試圖像集;
步驟2,圖像預處理,將獲取的圖像灰度化;
步驟3,采用SIFT對圖像進行局部特征檢測和描述;
包括圖像關鍵點檢測以及將關鍵點表示為128維的特征描述子;
步驟4,生成“詞袋”;
將步驟3提取的所有訓練集圖像的局部特征通過k-means算法進行聚類,然后將若干聚類中心作為“詞袋”中的詞,建立“詞袋”;
步驟5,使用“詞袋”中的詞對圖像進行描述;
將訓練圖像集和測試圖像集中的每幅圖像的局部特征用“詞袋”中的詞進行描述,得到“詞袋”中詞的頻數向量;
步驟6,建立有監督學習的潛在主題模型;
將步驟5中得到的圖像的詞頻數向量作為輸入潛在主題模型輸入變量,設定潛在主題的數目,采用mean-field?variational算法對有監督學習的潛在主題模型的參數進行學習,得到圖像的類別響應;
步驟7,識別未知圖像;
圖像類別為sLDA模型中響應變量達到最大期望值時類別值,用公式表示為:
其中,c*為圖像的類別。
2.根據權利要求1所述的一種基于有監督學習概率主題模型的地點圖像識別方法,其特征在于,所述步驟6建立有監督學習的潛在主題模型的方法包括以下步驟:
步驟6.1,生成圖像主題分布參數;
圖像主題分布概率θd的先驗分布服從參數為α的Dirichlet分布,即θd~Dir(α);
步驟6.2,生成圖像特征參數;
圖像的第n個特征wd,n對應的主題為zd,n,zd,n服從參數為θd的Multinomial分布,即zd,n~Mult(θd);圖像的第n個特征wd,n在主題zd,n下的概率服從參數為的Multinomial分布,即
步驟6.3,生成圖像類別標簽;
圖像類別cd服從參數為的softmax回歸,即其中
第d幅圖像屬于類別c的概率為:
其中,為第d幅圖像的特征向量,c為第d幅圖像的類別;
在sLDA模型中,根據圖像的特征信息很難計算主題概率的后驗分布因此采用mean-field?variational算法近似計算上述后驗分布;Variational算法假設隱含變量的概率分布是一些相互獨立變量的條件分布,然后通過最小化KL距離來近似真實的后驗條件分布;mean-field?variational分布為使用mean-field?variational算法時sLDA模型中隱變量的概率分布,即其中γ是變分Dirichlet參數,φn是K個主題的變分多項式分布參數;用mean-field?variational算法估計sLDA模型參數的方法如下:
(1)估算γ和φn;
根據variational算法得到變分目標函數,即似然函數,其表達式為:
通過最大化上述似然函數的近似下界函數L(γ,φn;α,π,η),計算隱變量的參數γ和φn,使其分布在當前sLDA模型參數下盡可能逼近其真實分布,公式如下:
其中,i表示的是主題,c表示的是類別,為上一次迭代過程中的φn值,h為便于sLDA模型中參數φn計算進而假設的參數,滿足
(2)估算π和η;
用γ和φn更新π和η,公式如下:
η=(E[ATA])-1E[A]Ty
其中,i表示主;y為圖像類別響應函數,且滿足A是為了便于sLDA模型中參數η計算假設的參數,滿足
重復上述(1)、(2)兩個步驟,直至隱變量γ和φn收斂。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工業大學,未經北京工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410064526.6/1.html,轉載請聲明來源鉆瓜專利網。





