[發明專利]矩陣數據索引方法及裝置在審
| 申請號: | 201410159202.0 | 申請日: | 2014-04-18 |
| 公開(公告)號: | CN105095208A | 公開(公告)日: | 2015-11-25 |
| 發明(設計)人: | 穆亞東;赫彩鳳;范偉 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 劉芳 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 矩陣 數據 索引 方法 裝置 | ||
技術領域
本發明涉及數據處理技術,尤其涉及一種矩陣數據索引方法及裝置。
背景技術
矩陣是一種常見的數據表達形式,廣泛應用于多個領域。但是,矩陣數據往往尺寸較大,直接保存矩陣會占用較大的存儲空間,也不便于對矩陣數據進行索引;當前,針對矩陣的索引,可以有多種不同的算法,其中,在矩陣維度較大時,索引函數的復雜度是一個不可忽略的問題,具體地,對于一個矩陣元素個數為百萬量級,對于一些復雜度高的索引函數,其參數個數也會在百萬量級,存儲大量的索引函數也會耗費大量的存儲空間。
現有技術中,對于矩陣數據的索引,主要是將矩陣數據展開為向量,即將矩陣逐行或逐列拼接,然后采用向量索引技術加以處理。現有的向量索引技術主要包括基于樹的方法,例如:K維樹(k-dtree)方法。但是,采用這種方法,在矩陣維度較高的情況下無法獲取合理的計算復雜度。
另外,現有技術中,對于矩陣元素較多的情況,還采用對矩陣元素欠采樣(under-sampling)的方法,這種方法通過減少參與索引計算的元素個數,降低索引函數的復雜度。但是,采用這種方法會造成有效信息的損失,從而導致索引函數性能下降。
發明內容
本發明實施例提供一種矩陣數據索引方法及裝置,用于解決現有技術矩陣索引方法在矩陣維度較高的情況下無法獲取合理的計算復雜度,以及有效信息損失的問題。
本發明實施例第一方面提供一種矩陣數據索引方法,包括:
獲取目標矩陣,其中,所述目標矩陣包括n×m個元素;
利用雙線性哈希函數,獲取所述目標矩陣對應的二值哈希碼;
根據所述二值哈希碼進行矩陣數據索引。
結合第一方面,在第一方面的第一種可能的實施方式中,所述利用雙線性哈希函數,獲取所述目標矩陣對應的二值哈希碼之前,還包括:
根據所述目標矩陣,獲取預設組高斯隨機變量;
其中,每組所述高斯隨機變量包括:第一高斯隨機變量和第二高斯隨機變量,所述第一高斯隨機變量為n維向量,所述第二高斯隨機變量為m維向量。
結合第一方面的第一種可能的實施方式,在第一方面的第二種可能的實施方式中,所述二值哈希碼包括0和1。
結合第一方面的第二種可能的實施方式,在第一方面的第三種可能的實施方式中,所述雙線性哈希函數為其中,X表示所述目標矩陣,uk表示所述第一高斯隨機變量,vk表示所述第二高斯隨機變量,表示所述uk的轉置向量。
結合第一方面的第二種可能的實施方式,在第一方面的第四種可能的實施方式中,所述利用雙線性哈希函數,獲取所述目標矩陣對應的二值哈希碼之前,還包括:
根據所述目標矩陣,獲取所述目標矩陣的隨機置換函數。
結合第一方面的第四種可能的實施方式,在第一方面的第五種可能的實施方式中,所述雙線性哈希函數為其中,φ(X)表示所述目標矩陣的置換函數,uk表示所述第一高斯隨機變量,vk表示所述第二高斯隨機變量,表示所述uk的轉置向量。
本發明第二方面提供一種矩陣數據索引裝置,包括:
獲取模塊,用于獲取目標矩陣,其中,所述目標矩陣包括n×m個元素;利用雙線性哈希函數,獲取所述目標矩陣對應的二值哈希碼;
索引模塊,用于根據所述二值哈希碼進行矩陣數據索引。
結合第二方面,在第二方面的第一種可能的實施方式中,所述獲取模塊,還用于在利用雙線性哈希函數,獲取所述目標矩陣對應的二值哈希碼之前,根據所述目標矩陣,獲取預設組高斯隨機變量;
其中,每組所述高斯隨機變量包括:第一高斯隨機變量和第二高斯隨機變量,所述第一高斯隨機變量為n維向量,所述第二高斯隨機變量為m維向量。
結合第二方面的第一種可能的實施方式,在第二方面的第二種可能的實施方式中,所述二值哈希碼包括0和1。
結合第二方面的第二種可能的實施方式,在第二方面的第三種可能的實施方式中,所述雙線性哈希函數為其中,X表示所述目標矩陣,uk表示所述第一高斯隨機變量,vk表示所述第二高斯隨機變量,表示所述uk的轉置向量。
結合第二方面的第二種可能的實施方式,在第二方面的第四種可能的實施方式中,所述獲取模塊,還用于在利用雙線性哈希函數,獲取所述目標矩陣對應的二值哈希碼之前,根據所述目標矩陣,獲取所述目標矩陣的隨機置換函數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410159202.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:移動終端新聞瀏覽的方法及裝置
- 下一篇:基于PDF級的局部掛網處理方法和裝置
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





