[發(fā)明專利]一種基于對(duì)特征方向進(jìn)行聚類的無監(jiān)督哈希檢索方法有效
| 申請(qǐng)?zhí)枺?/td> | 201810134469.2 | 申請(qǐng)日: | 2018-02-09 |
| 公開(公告)號(hào): | CN108491430B | 公開(公告)日: | 2021-10-15 |
| 發(fā)明(設(shè)計(jì))人: | 鄧偉洪;袁彤彤 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06F16/583 | 分類號(hào): | G06F16/583;G06F16/53;G06K9/62 |
| 代理公司: | 北京永創(chuàng)新實(shí)專利事務(wù)所 11121 | 代理人: | 祗志潔 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 特征 方向 進(jìn)行 監(jiān)督 檢索 方法 | ||
1.一種基于對(duì)特征方向進(jìn)行聚類的無監(jiān)督哈希檢索方法,其特征在于,包括如下步驟:
步驟一、從圖像數(shù)據(jù)集中隨機(jī)選取圖像,進(jìn)行去噪處理,獲取訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集;
步驟二、對(duì)訓(xùn)練數(shù)據(jù)集中的圖像,進(jìn)行特征提取;
步驟三、特征降維,具體是:使用K-means方法對(duì)提取的訓(xùn)練集圖像的特征進(jìn)行列聚類,生成類別中心和每列特征的索引;把屬于同一個(gè)類別中心的特征列組成一個(gè)集合,并通過數(shù)值運(yùn)算求均值的操作從各聚類集合中獲得新的一維特征,設(shè)生成維度為K的特征;K為正整數(shù);
所述的步驟三包括:
步驟3.1,設(shè)提取的訓(xùn)練數(shù)據(jù)集的原始特征數(shù)據(jù)X,第j列表示為xj,使用K-means方法對(duì)特征的列維度d進(jìn)行聚類,目標(biāo)是最小化類內(nèi)的平方和:
其中,S={s1,s2,…si,…,sK},K為聚類個(gè)數(shù),si表示特征聚類之后的集合,si中包含的元素是以u(píng)i為中心的特征序列;d為圖像的原始特征維度;
步驟3.2,對(duì)步驟3.1中得到的K個(gè)集合中的特征都進(jìn)行取列均值操作,每個(gè)集合si得到一個(gè)對(duì)應(yīng)的yi;
其中,I(xj∈si)是一個(gè)判斷函數(shù),如果括號(hào)里內(nèi)容為真則結(jié)果為1,否則為0;
步驟3.3,利用得到的{y1,y2,…,yi,…,yK}來組成新的特征,其中Kd;
步驟四、使用自適應(yīng)的量化方法對(duì)步驟三獲得的新特征進(jìn)行哈希量化;
使用K-means聚類方法把每一個(gè)特征維度的數(shù)據(jù)點(diǎn)聚成兩類,并得到兩個(gè)類別中心,對(duì)新特征中的數(shù)據(jù)依據(jù)距離兩個(gè)類別中心的遠(yuǎn)近,分別量化為0或1;
步驟五、進(jìn)行圖像檢索,具體是:
對(duì)測(cè)試集中的查詢圖像進(jìn)行步驟二的特征提取,對(duì)提取的特征依次利用步驟三進(jìn)行特征降維,利用步驟四進(jìn)行哈希量化,得到該圖像的二值編碼;計(jì)算該圖像的二值編碼與步驟四得到的訓(xùn)練集的二值編碼之間的漢明距離,按照漢明距離大小對(duì)訓(xùn)練集進(jìn)行排序,返回查詢圖像與訓(xùn)練樣本之間的漢明距離的排序結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的步驟一,包括如下步驟:
步驟1.1,設(shè)圖像數(shù)據(jù)集中包含m類圖像,為每類隨機(jī)選取設(shè)定數(shù)量的樣本;m為正整數(shù);
步驟1.2,采用信息熵來消除噪聲過大的草圖樣本;
某樣本所含的信息熵H為:其中,Pi是灰度值i在草圖中占的比例,i取值0和255,0和255分別表示灰度圖的黑點(diǎn)和白點(diǎn);
計(jì)算出每個(gè)類別中所有樣本的信息熵;
步驟1.3,對(duì)于每個(gè)類別的樣本的信息熵使用核密度估計(jì)計(jì)算出概率密度函數(shù),選取處于中間80%的概率密度的圖像,作為去噪后的干凈數(shù)據(jù)集;
步驟1.4,為每個(gè)類別從干凈數(shù)據(jù)集中選取測(cè)試集和訓(xùn)練集。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述的圖像數(shù)據(jù)集為Quick Draw草圖數(shù)據(jù)集,進(jìn)行特征提取時(shí),使用324維的HOG特征。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的K取值為16、32或64。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述的步驟四中,包括如下步驟:
步驟S4.1:對(duì)第三步得到每一維特征進(jìn)行K-means聚類,聚成兩類,保留每個(gè)維度得到的兩個(gè)類別中心;設(shè)對(duì)特征列yi聚類得到的兩個(gè)類別中心為c1、c2;
步驟S4.2:將特征列yi的實(shí)數(shù)值yji按照得到的類別中心進(jìn)行量化得到列向量Bi,距離c1近的一類數(shù)據(jù)點(diǎn)量化為0,距離c2近的一類數(shù)據(jù)點(diǎn)量化為1;
得到最終的哈希二值編碼B,Bji表示B中第j行第i列的元素。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810134469.2/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 請(qǐng)求沒有進(jìn)行IMS注冊(cè)的用戶進(jìn)行注冊(cè)的方法
- 對(duì)要進(jìn)行紋理操作的像素進(jìn)行分組
- 對(duì)餐盤進(jìn)行溫度調(diào)節(jié)和進(jìn)行分配的獨(dú)立小車
- 對(duì)圖像進(jìn)行編碼
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 對(duì)任務(wù)進(jìn)行調(diào)度
- 蛋糕(甜蜜進(jìn)行時(shí))
- 對(duì)定位輔助數(shù)據(jù)進(jìn)行分級(jí)和分組以進(jìn)行廣播
- 對(duì)物體進(jìn)行分離和定向以進(jìn)行供料
- 對(duì)工件進(jìn)行評(píng)價(jià)以進(jìn)行加工的方法





