[發明專利]基于局部特征多級聚類及圖像-類距離計算的商品圖像自動分類算法有效
| 申請號: | 201110340761.8 | 申請日: | 2011-11-02 |
| 公開(公告)號: | CN102509111A | 公開(公告)日: | 2012-06-20 |
| 發明(設計)人: | 孔祥維;賈世杰 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 梅洪玉;關慧貞 |
| 地址: | 116024*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 局部 特征 多級 圖像 距離 計算 商品 自動 分類 算法 | ||
技術領域
本發明涉及的是一種商品圖像的自動分類方法,具體是一種基于局部特征分級聚類及圖像-類距離計算的商品圖像分類算法。
背景技術
隨著互聯網的發展,電子商務的逐漸普及。電子商務網站需要通過對在線銷售商品進行標注以方便用戶進行搜索。但“一圖勝千言”,傳統的基于人工標注的方法不但費時費力,又難做到準確完整。如果在網站中設置圖片分類過濾器,無疑能方便用戶進行瀏覽。基于視覺信息的圖像自動分類技術能夠方便商家和用戶,如進行商品自動標注和輔助圖像檢索。
基于視覺信息的圖像自動分類是是根據圖像的視覺特征對圖像進行自動語義分類,需要克服類內差異、遮擋、姿態變化和背景干擾對分類帶來的不利影響,目前是計算機視覺領域最具挑戰的課題之一。針對商品圖像分類,B.Tomasik等(Tagging?products?using?image?classification,in?Proceedings?of?the?32nd?international?ACM?SIGIR?conference?on?Research?and?development?in?information?retrieval.2009,ACM:Boston,MA,USA.)探討了運用圖像分類進行圖像標注的方法,在2-3類商品圖像上取得了66%-96%的準確率。Oren?Boiman等(In?Defense?of?Nearest-Neighbor?Based?Image?Classification,Proceedings?of?IEEE?Conference?on?Computer?Vision?and?Pattern?Recognition)提出了一種樸素貝葉斯最近鄰的分類器NBNN,(Naive-Bayes?Nearest-Neighbor),在圖像局部特征空間采用最近鄰方法,計算圖像-類之間的距離,并且證明了在基于貝葉斯假設下,這種分類器可以近似理論上最優的圖像分類器。但由于這種方式基于窮盡搜索,當標記圖像數目比較多、類別數比較大時,運行時間就會變得越來越大,很難達到實際應用的要求。本發明在此基礎上提出了基于局部特征聚類及樸素貝葉斯分類器的商品圖像分類算法。首先在圖像局部特征空間進行分級層次聚類,形成若干個分級聚類中心,在計算圖像-類距離時,首先計算圖像和每類各個分級聚類中心之間的距離,找出每類最近鄰的聚類中心。在此聚類包含的所有描述子中計算圖像各描述子的最近鄰,將圖像各描述子與其對應最近鄰描述子的距離進行相加,得到的距離之和即為圖像-類之間的距離。測試圖像的類別即為最小距離所對應的類別。
本發明可在保證較高正確率的情況下有效提高計算速度,適用于較大規模的商品圖像分類。
發明內容
本發明要解決的技術問題是基于視覺特征的商品圖像自動分類,提供了一種基于視覺信息的商品圖像自動分類方法,這種方法提取圖像局部特征,采用分級聚類和圖像-類距離計算的方法實現類別識別。
本發明的技術方案如下:
步驟一.取已分好類的商品圖像作為分類器標記樣本;
步驟二.以稠密采樣方式提取并描述各標記圖像類的局部圖像特征(如:SIFT)。
步驟三.將各類內訓練圖片提取的局部特征進行層次聚類,形成若干個分級聚類中心,并標記隸屬于每個聚類中心的圖像塊描述子;
步驟四.以稠密采樣方式提取并描述測試圖片局部特征(SIFT);
步驟六.依次計算測試圖像每個圖像塊到各類各分級聚類中心的L2距離,找出每個測試圖像塊與每個標記類距離和最小的聚類中心;
步驟七.在相應最近鄰聚類中,依次計算各圖像局部特征塊的最近鄰描述子,并計算對應L2距離;
步驟八.對應L2距離和最小的類別即為分類結果。
本發明的效果和益處能夠根據商品圖像的視覺內容實現商品自動分類;采用每類圖像局部特征描述子分級層次聚類的方法,大大減少了圖像-類距離計算中的窮盡搜素問題,大大提高了計算效率。在計算圖像塊之間距離時,充分考慮特征所在位置信息,能夠提高分類效果。
附圖說明
附圖1是本發明算法基本過程示意框圖。
附圖2是本發明算法訓練和測試過程流程圖。
附圖3是圖像-類距離計算方法示意圖。
附圖4是本發明實施例中的部分圖庫示意圖。
具體實施方式
如圖1所示,具體描述如下步驟如下:
步驟一.獲取取已知類別的商品圖像樣本,每類10~50個樣本;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110340761.8/2.html,轉載請聲明來源鉆瓜專利網。





