[發明專利]一種基于優化視覺詞袋模型的圖像場景分類方法有效
| 申請號: | 202011352621.8 | 申請日: | 2020-11-27 |
| 公開(公告)號: | CN112329798B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 宋濤;趙明富;王瑜琳;羅彬彬;石勝輝;吳德操;巫濤江;鄒雪 | 申請(專利權)人: | 重慶理工大學;重慶能源職業學院 |
| 主分類號: | G06V10/46 | 分類號: | G06V10/46;G06V10/50;G06V10/762;G06V10/774;G06V10/764;G06N20/20 |
| 代理公司: | 北京深川專利代理事務所(普通合伙) 16058 | 代理人: | 謝雪梅 |
| 地址: | 400054 *** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 優化 視覺 模型 圖像 場景 分類 方法 | ||
1.一種基于優化視覺詞袋模型的圖像場景分類方法,其特征在于,包括以下步驟:
S1:確定需要進行區分的場景類別數s,選定訓練樣本和測試樣本,每一類場景分別采集kt張圖像作為訓練樣本,并選定ks張圖像作為測試樣本;
S2:采用網格化均勻提取Sift特征點,設定網格圖像塊大小pt和塊間隔dt,對訓練樣本和測試樣本中每張圖像進行均勻化網格劃分,得到若干個圖像塊,計算每個圖像塊的中心點sift特征描述向量,得到每張圖像的特征描述向量集合Fi;
S3:設定Kmeans方法的聚類中心數c,迭代運算次數和收斂誤差,對樣本的所有特征描述向量進行K均值聚類,獲得聚類中心向量集合,即詞袋庫W;
S4:Kmeans聚類過程得出每個單詞包含的特征描述向量集,進而獲得每個單詞中特征點來源分布SW,計算每個單詞對場景類別的表征能力,得到單詞可信度向量R;
S5:根據詞袋模型方法分別獲得訓練樣本和測試樣本的全局描述,即計算每張圖像的特征直方圖;
S6:基于修正直方圖交叉核函數的相似性度量方法計算每個測試樣本圖像與每個訓練樣本的相似性,得到相似性矩陣I;
S7:設置k近鄰分類中鄰域大小d,基于近鄰分類器分別計算每個測試樣本所屬的場景類別;
所述步驟S4單詞可信度向量R=[r1,r2,…,rc],其中:
其中,std(·)表示標準差,表示聚類成單詞i的所有特征點的個數;
所述步驟S6基于單詞可信度修正直方圖交叉核函數的相似性度量函數定義如下:
其中,Xi為測試樣本特征直方圖描述向量集合X={X1;X2;…;Xm},Yj為訓練樣本特征直方圖描述向量集合Y={Y1;Y2;…;Yn},測試樣本圖像Xi的歸一化特征直方圖為H(Xi)∈Rc,訓練樣本圖像Yj的歸一化特征直方圖為H(Yj)∈Rc,即
2.如權利要求1所述的一種基于優化視覺詞袋模型的圖像場景分類方法,其特征在于,所述步驟S2中特征點的sift特征描述向量集合為:
F={f1,f2,…,fp}∈Rp×128?????????(3)
其中,fi表示特征點i的sift描述向量,p表示一張圖像提取的sift特征點數,特征點由sift方法關鍵點檢測確定,或通過圖像均勻網格劃分確定,128表示sift特征維數。
3.如權利要求1所述的一種基于優化視覺詞袋模型的圖像場景分類方法,其特征在于,所述步驟S3詞袋庫W的生成方式為:
W=Kmeans([F1,F2,…,FnTr],c)
={w1,w2,…wc}?????????????????????(4)
其中,W∈Rc×128表示詞袋庫,通過對所有訓練樣本的sift特征集合進行k均值聚類獲得,wj表示詞袋庫中的一個單詞,c表示詞袋庫的大小,即單詞的個數,每個單詞128維。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶理工大學;重慶能源職業學院,未經重慶理工大學;重慶能源職業學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011352621.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種分布式數據采集調度方法及相關裝置
- 下一篇:一種成品紙收卷自測壓邊裝置





