[發明專利]平衡多級存儲性能與固態硬盤壽命的數據緩沖方法有效
| 申請號: | 201310333194.2 | 申請日: | 2013-08-02 |
| 公開(公告)號: | CN103399713A | 公開(公告)日: | 2013-11-20 |
| 發明(設計)人: | 尹建偉;馮馳;鄧水光;李瑩;吳健;吳朝暉 | 申請(專利權)人: | 浙江大學 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06 |
| 代理公司: | 杭州天勤知識產權代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310027 浙*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 平衡 多級 存儲 性能 固態 硬盤 壽命 數據 緩沖 方法 | ||
技術領域
本發明涉及數據存儲技術領域,尤其涉及一種平衡多級存儲性能與固態硬盤壽命的數據緩沖方法。
背景技術
隨著計算機技術的發展和互聯網的普及,特別是云計算的興起,人們對存儲性能的需求不斷提高。互聯網上持續增長的海量數據對后臺存儲系統的性能有著很高的要求。目前的存儲系統將重點放在分布式上,通過集群擴展來提高性能,并借助分布式緩存和內容分發網絡(Content?distribution?network,CDN)來提升熱點數據的讀取性能。因此,存儲系統需要關注數據寫入性能的瓶頸,除了依賴集群擴展外,還應考慮提升單機性能。
多級存儲體系是一種常用的提升單機存儲性能的方法。基于閃存的固態硬盤(Solid?State?Disk,SSD)具有優秀的隨機和連續讀寫能力,因此以固態硬盤作為機械硬盤(Hard?Disk?Drive,HDD)的數據讀寫緩沖區的多級存儲體系成為了存儲系統中的重要組成部分,數據先寫入固態硬盤,由于固態硬盤的容量小,數據最終會被遷移至機械硬盤。
固態硬盤中的每個存儲單元的擦寫次數有限,超過該上限的存儲單元極易損壞,無法安全地存儲數據,導致固態硬盤的壽命有限。另外,由于價格昂貴,且固態硬盤的容量小,導致數據從固態硬盤遷移到機械硬盤的次數多,增加了固態硬盤的數據擦寫次數,進一步降低了固態硬盤的使用壽命,提高使用的成本。因此,如何在充分利用固態硬盤性能的同時延長其使用壽命,降低成本,將成為存儲系統需要考慮的重要問題。
目前常見的多級存儲體系中延長固態硬盤壽命的方法包括:
1)基于請求特性適配的方法。這類方法考慮了固態硬盤和機械硬盤各自的特性,并根據存儲請求的特性進行IO調度。由于固態硬盤的優勢主要體現在隨機讀寫能力上,因此將小數據先寫入固態硬盤,而大數據直接寫入機械硬盤,從而減少固態硬盤的擦寫次數。
2)基于負載控制的方法。這類方法完全基于固態硬盤的壽命指標,根據其最大擦寫能力和用戶期望壽命(手動設定使用時長),計算出單位時間內的額定寫入負載量,該負載量內的數據寫入固態硬盤,超出該負載量的數據直接寫入機械硬盤。同時,根據過去未使用的負載量計算儲備負載量,用于在突發情況下動態調整短期額定寫入負載量。
但是在實際應用場景中,用戶請求數量會隨著時間波動,形成負載波動特性,甚至低負載時僅使用機械硬盤就能滿足性能需求了;同時機械硬盤的離散數據操作也能提供一定的讀寫性能。以上兩類方法均缺少對負載波動特性的考慮,也沒有充分利用機械硬盤的性能資源,調度策略不夠靈活,對固態硬盤的壽命保護不足,有待進一步改進。并且第二類方法中衡量指標過于單一,過于注重壽命而缺少了對性能指標的保證。
發明內容
本發明針對現有技術的數據緩沖方法在提高固態硬盤壽命時對實際使用情況考慮不全面的問題,提供了一種在考慮數據大小、負載波動特性與機械硬盤工作狀態,且保證數據讀寫性能的條件下,延長固態硬盤使用壽命的數據緩沖方法。
一種平衡多級存儲性能與固態硬盤壽命的數據緩沖方法,應用于安裝有固態硬盤和機械硬盤的服務器上,在數據的讀取和寫入時分別執行如下步驟:
數據讀取:判斷數據的存放位置,根據存放位置對應地從固態硬盤或機械硬盤中讀取;
數據寫入:根據寫入請求判斷數據的大小類型,分別執行如下操作:
S1)若數據大于閥值,則為大數據,直接寫入機械硬盤;
S2)若數據小于或等于閥值,則為小數據,此時若機械硬盤空閑,則寫入機械硬盤,若機械硬盤繁忙則寫入固態硬盤。
本發明的數據緩沖方法將大數據直接寫入機械硬盤,小數據選擇性地使用固態硬盤緩沖,當機械硬盤工作狀態空閑時,優先將小數據寫入機械硬盤。由于充分考慮了數據大小、負載波動特性與機械硬盤工作狀態,因此在保證數據讀寫性能的同時能夠降低固態硬盤的讀寫次數,提升使用壽命。
在所述數據的讀取和寫入之前,還包括初始化過程,初始化過程中在所述存儲服務器的內存中建立固態硬盤緩沖數據的索引哈希表和索引LRU雙向鏈表,在數據讀取時,根據所述索引哈希表和索引LRU雙向鏈表判斷數據的存放位置。
建立索引哈希表用于查詢數據的存儲位置,有利于于提高讀取速度。建立索引LRU雙向鏈表用于區分熱點與非熱點數據,有利于保留熱點數據來提升讀取性能。
所述步驟S2)中,判定機械硬盤的空閑與繁忙時,若機械硬盤當前狀態同時符合以下條件,則判定機械硬盤空閑:
a)機械硬盤當前無大數據讀寫操作,
b)機械硬盤當前無數據遷移操作,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江大學,未經浙江大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310333194.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:存儲設備配置管理系統及其使用方法
- 下一篇:晶粒分離裝置





