[發明專利]一種基于文件熱度分析和K-means的副本放置方法在審
| 申請號: | 201510943677.3 | 申請日: | 2015-12-16 |
| 公開(公告)號: | CN105574153A | 公開(公告)日: | 2016-05-11 |
| 發明(設計)人: | 馬廷淮;李堅;田偉;金子龍 | 申請(專利權)人: | 南京信息工程大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 江蘇愛信律師事務所 32241 | 代理人: | 唐小紅 |
| 地址: | 210000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 文件 熱度 分析 means 副本 放置 方法 | ||
1.一種基于文件熱度分析和K-means的副本放置方法,其特征在于,包括以下步驟:
步驟1),根據任務的執行時間,選擇最小值作為熱度分析的時間周期,在該時間周期內 分析文件的訪問頻率;
步驟2),根據步驟1)得到的文件訪問頻率,計算文件的訪問熱度值;
步驟3),根據步驟2)得到的文件訪問熱度值,獲取高熱度值的文件的信息,通過K- means算法,計算并預測下一運行周期的高熱度文件;
步驟4),根據步驟3)得到的高熱度文件信息,綜合考慮文件大小、文件數量、文件位置、 工作環境等眾多因素動態地調整文件副本的數量以及放置位置。
2.根據權利要求1所述的方法,其特征在于,步驟1)中使用了文件訪問次數計數器和統 計周期計時器;初始化時,默認文件訪問次數為1,每個統計周期內,文件每次被訪問計數器 加1,未被訪問則計數器減1;若訪問次數已經為1,則計數器不再執行減1操作。若文件訪問 超時未完成,訪問計數器加1;若文件在第k個統計周期內的訪問頻率fk=n/t,其中n為該文 件在統計周期內被訪問的次數,t為統計周期內訪問的持續時間之和。
3.根據權利要求1所述的方法,其特征在于,步驟2)中根據步驟1)得到的文件訪問頻 率,利用公式hij=α·Fj/(Si+1),計算文件i在j時刻的訪問熱度值;公式中,α為常量,用于 對數據進行歸一化處理;Fj表示頻率對文件訪問熱度的影響,Si表示文件大小對文件訪問熱 度的影響;其中,
4.根據權利要求1所述的方法,其特征在于,步驟3)根據步驟2)得到的文件訪問熱度 值,獲取高熱度值的文件的信息,選取k個文件作為初始化中心,計算每個文件到中心文件 的距離,將每個文件分配至最近的簇。根據現有的簇關系重復計算前述過程,直至滿足終止 條件;終止條件包括:
(1)沒有(或最小數目)文件被重新分配給不同的聚類;
(2)沒有(或最小數目)聚類中心發生變化;
(3)誤差平方和(SSE)局部最小,其中x表示文件,mj表示聚類 Cj的聚類中心,dist(x,mj)表示文件x與聚類中心mj之間的距離。
5.根據權利要求1所述的方法,其特征在于,步驟4)中根據步驟3)得到的聚類信息,根 據各個聚類中心的訪問熱度,綜合考慮文件大小、文件數量、文件位置、工作環境等眾多因 素動態地調整文件副本的數量以及放置位置,高熱度的簇適當增加副本數量,低熱度的簇 課適當減少副本數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京信息工程大學,未經南京信息工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510943677.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種時鐘校準方法、裝置和系統
- 下一篇:變倍率液態鏡頭裝置





