[發(fā)明專利]哈希編碼方法和裝置有效
| 申請?zhí)枺?/td> | 201410364922.0 | 申請日: | 2014-07-29 |
| 公開(公告)號: | CN105320685B | 公開(公告)日: | 2019-03-19 |
| 發(fā)明(設(shè)計)人: | 劉汝杰;劉曦 | 申請(專利權(quán))人: | 富士通株式會社 |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 樊一槿 |
| 地址: | 日本神奈*** | 國省代碼: | 日本;JP |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 投影 方法和裝置 聚類中心 哈希 大規(guī)模數(shù)據(jù) 自適應(yīng)學(xué)習(xí) 最大化原則 多維數(shù)據(jù) 二值編碼 近鄰查詢 近鄰結(jié)構(gòu) 數(shù)據(jù)投影 閾值量化 有效地 聚類 拼合 預(yù)設(shè) 索引 量化 | ||
1.一種哈希編碼裝置,其中,所述裝置包括:
投影單元,其基于給定的訓(xùn)練數(shù)據(jù)集生成多個投影方向;
聚類單元,其將所述訓(xùn)練數(shù)據(jù)集中的所有訓(xùn)練數(shù)據(jù)在每一個所述投影方向上進(jìn)行投影,得到對應(yīng)每一個投影方向的一組投影值,利用預(yù)先設(shè)定的聚類算法對每一個投影方向?qū)?yīng)的投影值進(jìn)行聚類,得到對應(yīng)每一個投影方向的預(yù)定數(shù)量的聚類中心;
閾值確定單元,其根據(jù)每一個投影方向?qū)?yīng)的預(yù)定數(shù)量的聚類中心,根據(jù)熵最大化原則確定對應(yīng)每一個投影方向的多個閾值,包括:對于每一個投影方向,根據(jù)所述投影方向?qū)?yīng)的聚類中心的個數(shù)確定所述閾值的個數(shù),其中,所述閾值的個數(shù)為所述聚類中心的個數(shù)減1;對每個閾值賦予候選值;迭代所有閾值的所有候選值,分別計算出相應(yīng)的熵值;將熵值最大所對應(yīng)的一組閾值的候選值作為所述多個閾值;所述多個閾值不包含兩個閾值;
編碼單元,其利用對應(yīng)每一個投影方向的多個閾值,對輸入數(shù)據(jù)在所述每一個投影方向的投影值進(jìn)行編碼,得到所述輸入數(shù)據(jù)的編碼。
2.根據(jù)權(quán)利要求1所述的裝置,其中,
所述閾值確定單元根據(jù)候選值的計算公式Thri=ci+b*(ci+1-ci)/B,b=2,…,B-1對每個閾值賦予候選值,其中,ci為第i個聚類中心的值,ci+1為第i+1個聚類中心的值,B為預(yù)先指定的塊數(shù)。
3.根據(jù)權(quán)利要求1所述的裝置,其中,
所述閾值確定單元根據(jù)熵的計算公式Entropy=∑i=1,...,k-probilogprobi計算每個閾值的候選值的熵,其中,k為所述聚類中心的個數(shù),k-1為所述閾值的個數(shù),probi為利用所述k-1個閾值將所述投影方向?qū)?yīng)的投影值劃分為k個區(qū)域后,第i個區(qū)域的概率,并且,ni為第i個區(qū)域所包含的數(shù)據(jù)的個數(shù)。
4.根據(jù)權(quán)利要求1所述的裝置,其中,所述編碼單元包括:
投影模塊,其將所述輸入數(shù)據(jù)在每一個所述投影方向進(jìn)行投影,得到所述輸入數(shù)據(jù)在每一個所述投影方向的投影值;
編碼模塊,利用對應(yīng)每一個投影方向的多個閾值和預(yù)先設(shè)定的編碼策略,將所述輸入數(shù)據(jù)在每一個所述投影方向上的投影值轉(zhuǎn)換為相應(yīng)的編碼;
連接模塊,連接所述輸入數(shù)據(jù)在所有投影方向上的投影值的編碼,得到所述輸入數(shù)據(jù)的編碼。
5.根據(jù)權(quán)利要求4所述的裝置,其中,所述編碼模塊所采用的預(yù)先設(shè)定的編碼策略為:
每一個投影方向所對應(yīng)的投影值下k-1個閾值劃分出的k個區(qū)域按照如下方式編碼:
從k-1位全0碼串依次每位遞增變?yōu)?,分別賦值給這k個區(qū)域。
6.根據(jù)權(quán)利要求5所述的裝置,其中,
對于第i個區(qū)域Ri,i=1,…,k,Ri的碼串是由(k-i)個0和(i-1)個1組成,也即Ri=0…01…1。
7.根據(jù)權(quán)利要求4所述的裝置,其中,所述編碼模塊包括:
比較子模塊,其將所述輸入數(shù)據(jù)在每一個所述投影方向上的投影值與對應(yīng)所述投影方向的多個閾值進(jìn)行比較,確定所述輸入數(shù)據(jù)在所述投影方向上的投影值所屬的數(shù)據(jù)區(qū)域;
編碼子模塊,其將所述輸入數(shù)據(jù)在所述投影方向上的投影值所屬的數(shù)據(jù)區(qū)域的編碼作為所述輸入數(shù)據(jù)在所述投影方向上的投影值的編碼。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于富士通株式會社,未經(jīng)富士通株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410364922.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:測試腳本的生成方法和裝置
- 下一篇:一種屏幕補(bǔ)光方法、裝置及移動終端
- 一種哈希表動態(tài)適應(yīng)數(shù)據(jù)的方法及裝置
- 數(shù)據(jù)完整性的保護(hù)和驗(yàn)證方法、設(shè)備和系統(tǒng)
- 創(chuàng)建哈希表的方法和設(shè)備
- 一種減少哈希沖突的哈希查找方法
- 一種哈希表處理方法、裝置、設(shè)備及存儲介質(zhì)
- 一種實(shí)現(xiàn)哈希運(yùn)算的專用計算電路
- 哈希桶查找方法、哈希表存儲、哈希表查找方法和裝置
- 醫(yī)療數(shù)據(jù)系統(tǒng)的權(quán)限管理方法
- 數(shù)據(jù)壓縮器以及數(shù)據(jù)壓縮方法
- 一種動態(tài)哈希方法、裝置、設(shè)備及存儲介質(zhì)





