[發(fā)明專利]存儲(chǔ)系統(tǒng)中基于溯源信息的文件元數(shù)據(jù)查詢方法與系統(tǒng)有效
| 申請?zhí)枺?/td> | 201410199580.1 | 申請日: | 2014-05-12 |
| 公開(公告)號(hào): | CN103970871B | 公開(公告)日: | 2017-06-16 |
| 發(fā)明(設(shè)計(jì))人: | 馮丹;劉進(jìn)軍;華宇;彭斌;聶振華;黃大彰;蔡娟 | 申請(專利權(quán))人: | 華中科技大學(xué) |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 華中科技大學(xué)專利中心42201 | 代理人: | 梁鵬 |
| 地址: | 430074 湖北*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 存儲(chǔ)系統(tǒng) 基于 溯源 信息 文件 數(shù)據(jù) 查詢 方法 系統(tǒng) | ||
1.一種存儲(chǔ)系統(tǒng)中基于溯源信息的文件元數(shù)據(jù)查詢方法,其特征在于,所述方法包括以下步驟:
(1)對安裝在存儲(chǔ)系統(tǒng)的客戶端的溯源信息收集工具,設(shè)置溯源信息收集范圍,獲取初始溯源信息后經(jīng)過處理分析得到文件相關(guān)性信息,然后將這些文件相關(guān)性信息發(fā)送到存儲(chǔ)系統(tǒng)的元數(shù)據(jù)服務(wù)器;
(2)根據(jù)元數(shù)據(jù)服務(wù)器接收的文件相關(guān)性信息,生成關(guān)系圖,所述關(guān)系圖為無向有權(quán)圖,所述關(guān)系圖中的節(jié)點(diǎn)代表文件,邊代表文件相關(guān)性;
(3)接收用戶的查詢請求,根據(jù)用戶的查詢條件在基于關(guān)聯(lián)感知的元數(shù)據(jù)索引樹中查詢得到種子結(jié)果集;
(4)根據(jù)得到的種子結(jié)果集在關(guān)系圖中進(jìn)行查詢,得到初始結(jié)果集,然后對初始結(jié)果集進(jìn)行排序和精簡得到最終結(jié)果集發(fā)送給查詢用戶;
如果步驟(4)中的所述查詢?yōu)門op K查詢,所述步驟(4)具體包括如下步驟:
(4-1-1)根據(jù)步驟(3)得到的種子結(jié)果集中的每個(gè)種子進(jìn)行查詢,獲取與每個(gè)種子最靠近的K個(gè)結(jié)果,并計(jì)算各個(gè)結(jié)果與查詢點(diǎn)之間的關(guān)系值,處理得到初始結(jié)果集;
(4-1-2)依據(jù)初始結(jié)果集中的各個(gè)結(jié)果與查詢點(diǎn)的關(guān)系值的大小,對初始結(jié)果集進(jìn)行排序,選取最好的K個(gè)結(jié)果作為最終結(jié)果集;
(4-1-3)將最終結(jié)果集返回給用戶;
如果步驟(4)中的所述查詢?yōu)榻谱罱彶樵?所述步驟(4)具體包括如下步驟:
(4-2-1)根據(jù)查詢條件在基于關(guān)聯(lián)感知的元數(shù)據(jù)索引樹中進(jìn)行查詢操作,得到與查詢請求最接近的那條數(shù)據(jù),計(jì)算這條數(shù)據(jù)與查詢請求之間的距離d,確定查詢半徑R為(1+ε)×d,ε為用戶輸入?yún)?shù),用于確定查詢半徑;
(4-2-2)根據(jù)步驟(3)得到的種子結(jié)果集中的每個(gè)種子進(jìn)行查詢,查找離種子節(jié)點(diǎn)在這個(gè)查詢半徑R內(nèi)的所有節(jié)點(diǎn),并計(jì)算各個(gè)節(jié)點(diǎn)與查詢點(diǎn)之間的關(guān)系值,處理得到初始結(jié)果集;
(4-2-3)依據(jù)初始結(jié)果集中的各個(gè)結(jié)果與查詢點(diǎn)的關(guān)系值的大小,對初始結(jié)果集進(jìn)行排序,得到最終結(jié)果集;
(4-2-4)將最終結(jié)果集返回給用戶。
2.根據(jù)權(quán)利要求1所述的文件元數(shù)據(jù)查詢方法,其特征在于,所述步驟(1)包括以下子步驟:
(1-1)在每一個(gè)存儲(chǔ)系統(tǒng)的客戶端程序中加入溯源信息收集模塊;
(1-2)設(shè)置溯源信息收集模塊收集溯源信息的范圍,即只收集存儲(chǔ)系統(tǒng)中涉及到文件相關(guān)性的信息;
(1-3)將在客戶端收集的溯源信息經(jīng)過去重,分析得到文件關(guān)系項(xiàng)后,將這些文件關(guān)系項(xiàng)發(fā)送到相應(yīng)的元數(shù)據(jù)服務(wù)器,所述每個(gè)文件關(guān)系項(xiàng)中包含發(fā)生關(guān)系的兩個(gè)文件的通用資源標(biāo)識(shí)符URI和相關(guān)性信息。
3.根據(jù)權(quán)利要求2所述的文件元數(shù)據(jù)查詢方法,其特征在于,所述步驟(2)包括以下子步驟:
(2-1)得到客戶端傳遞過來的各條文件關(guān)系項(xiàng);
(2-2)根據(jù)文件關(guān)系項(xiàng)中的兩個(gè)文件的URI分別判斷關(guān)系圖中是否已包含代表這兩個(gè)文件的節(jié)點(diǎn),如果不包含,則在關(guān)系圖中添加代表該文件的節(jié)點(diǎn);
(2-3)根據(jù)文件關(guān)系項(xiàng)中兩個(gè)文件的相關(guān)性信息,判斷該文件關(guān)系項(xiàng)是否已在關(guān)系圖中記錄,如果已記錄則更新這兩個(gè)文件的相關(guān)性信息,否則在關(guān)系圖中添加這一文件關(guān)系項(xiàng)。
4.根據(jù)權(quán)利要求1至3任一項(xiàng)所述的文件元數(shù)據(jù)查詢方法,其特征在于,在所述步驟(3)之前還包括建立基于關(guān)聯(lián)感知的元數(shù)據(jù)索引樹的步驟,具體為:
選擇文件屬性中能反映文件相關(guān)性的屬性,將每臺(tái)元數(shù)據(jù)服務(wù)器上的元數(shù)據(jù)根據(jù)這些屬性進(jìn)行劃分,然后建立索引,對所有的元數(shù)據(jù)服務(wù)器采用同樣的方法建立一個(gè)樹型的索引,從而在整個(gè)存儲(chǔ)系統(tǒng)中建立基于關(guān)聯(lián)感知的元數(shù)據(jù)索引樹。
5.根據(jù)權(quán)利要求1到3任一項(xiàng)所述的文件元數(shù)據(jù)查詢方法,其特征在于,所述步驟(3)包括以下子步驟:
(3-1)當(dāng)元數(shù)據(jù)服務(wù)器集群中的某一臺(tái)服務(wù)器接受到用戶的查詢請求后,通過查詢條件與集群中各個(gè)元數(shù)據(jù)服務(wù)器的文件屬性進(jìn)行比較,確定需要查詢的元數(shù)據(jù)服務(wù)器,并將查詢請求轉(zhuǎn)發(fā)給這臺(tái)服務(wù)器;
(3-2)這臺(tái)服務(wù)器接收到用戶請求后,根據(jù)查詢方式在元數(shù)據(jù)服務(wù)器內(nèi)部對基于關(guān)聯(lián)感知的元數(shù)據(jù)索引樹進(jìn)行查詢操作,得到的結(jié)果作為種子結(jié)果集;
(3-3)計(jì)算各個(gè)種子節(jié)點(diǎn)與查詢點(diǎn)之間的距離,并根據(jù)距離對種子結(jié)果集進(jìn)行排序,其中種子結(jié)果集中種子結(jié)果的個(gè)數(shù)由查詢條件確定。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華中科技大學(xué),未經(jīng)華中科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410199580.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 用于處理到遠(yuǎn)程存儲(chǔ)位置的故障恢復(fù)的方法、系統(tǒng)以及程序
- 包括向外擴(kuò)展型存儲(chǔ)系統(tǒng)的存儲(chǔ)系統(tǒng)群及其管理方法
- 一種移動(dòng)存儲(chǔ)系統(tǒng)及其存儲(chǔ)方法
- 存儲(chǔ)系統(tǒng)的數(shù)據(jù)備份與恢復(fù)系統(tǒng)、方法、設(shè)備及存儲(chǔ)介質(zhì)
- 在線遷移異構(gòu)系統(tǒng)數(shù)據(jù)的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 建立存儲(chǔ)系統(tǒng)伙伴關(guān)系的方法及裝置
- 數(shù)據(jù)處理系統(tǒng)及其操作方法
- 一種容災(zāi)平臺(tái)及一種容災(zāi)方法
- 在基于云的存儲(chǔ)系統(tǒng)中服務(wù)I/O操作
- 一種數(shù)據(jù)修復(fù)方法及裝置
- 溯源交互系統(tǒng)及溯源系統(tǒng)交互方法
- 單溯源碼農(nóng)產(chǎn)品分級溯源管理系統(tǒng)及方法
- 多溯源碼農(nóng)產(chǎn)品分級溯源管理系統(tǒng)及方法
- 食品安全溯源系統(tǒng)及方法
- 一種基于區(qū)塊鏈的溯源數(shù)據(jù)的獲取方法及相關(guān)設(shè)備
- 溯源方法、溯源裝置、溯源系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種基于區(qū)塊鏈技術(shù)的溯源應(yīng)用系統(tǒng)
- 一種基于區(qū)塊鏈技術(shù)的溯源管理系統(tǒng)
- 一種聚合溯源的方法和相關(guān)裝置
- 一種醫(yī)學(xué)實(shí)驗(yàn)室監(jiān)管溯源系統(tǒng)及方法
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲(chǔ)介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





