[發明專利]一種基于SSD 的緩存管理方法及系統有效
| 申請號: | 201210160350.5 | 申請日: | 2012-05-22 |
| 公開(公告)號: | CN102760101A | 公開(公告)日: | 2012-10-31 |
| 發明(設計)人: | 車玉坤;熊勁;馬久躍 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F12/08 | 分類號: | G06F12/08 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 ssd 緩存 管理 方法 系統 | ||
技術領域
本發明涉及緩存的存儲結構與策略,尤其涉及一種基于SSD的緩存管理方法及系統。?
背景技術
隨著當代社會的進步,需要處理的數據信息越來越多,數據量呈爆炸式增長。這給傳統的存儲系統帶來了許多問題。傳統的存儲系統一般由內存(DRAM)和硬盤(HDD)構成,DRAM作為HDD的緩存,這樣的系統面臨以下幾個挑戰:?
其一,數據總量在迅速增大。IDC和EMC的聯合報告指出:當今社會的數據呈爆炸式的增長趨勢,從他們的報告可以看出來,2005前以及之前的數據量僅為幾十EB(1EB=1018字節),2010年則為上千EB,預計到2015年則會到達接近8000EB,也就是8ZB(1ZB=1021字節)的數據量.面臨這樣的數據規模,傳統的DRAM+HDD存儲架構下,將有越來越多的I/O請求發向磁盤,因此性能會因請求的響應時間變長而受到產生影響。?
其二,I/O?gap在逐漸增大,HDD逐漸成為性能瓶頸。報告顯示,CPU性能每年以60%的速度增長,也就是每18個月翻一番。而HDD的性能卻每年增長速度小于10%,大約在8%左右,這是因為它受制于磁盤物理結構的特點,磁盤機械臂的尋道速度和盤面的旋轉速度,大約每10年才能翻一番。同時DRAM與HDD的延遲差距也在加大,以上這些導致HDD成為I/O的瓶頸。如果請求頻繁得發向磁盤,那么必然會嚴重降低系統的性能。?
其三,數據處理的性能需求在不斷提高。近年來,高性能計算逐漸由CPU密集型向I/O密集型轉變,系統的I/O效率對性能有著重要的影響,這就對存儲系統的I/O操作提出了很高的要求。此外互聯網服務的高速發展也對海量存儲系統的I/O操作性能提出了更高的要求,對于搜索引擎、電子商務、OSN之類的互聯網應用,它們需要同時處理大量用戶的操作請求,并且用戶感受到的響應時間必須是在可以接受的范圍(秒級以內)。這樣的應用特點就要求其底層的數據存儲系統必須具有很好的I/O性能,傳統的DRAM+HDD將越來越難以?勝任。?
SSD是近年來新興的一種新型存儲介質,它的出現極有可能幫助解決上述的挑戰。SSD的性能和價格均位于DRAM和HDD之間,如果將其加入到緩存系統中,將其做為HDD的二級緩存,極有可能提高系統的性能,由于其容量比DRAM要大,同時性能較HDD好于若干個數量級,因此預計可以有效的減少發往HDD的請求。但是SSD有許多獨特的特性,使得直接將SSD引入DRAM和HDD之間作為緩存會存在許多問題,導致SSD的性能得不到最大化利用.這些特性如下:?
第一,SSD的讀寫性能不對稱,讀操作的性能遠遠好于寫操作,在隨機操作而且粒度較小的情況下更差,然而傳統的緩存系統中,數據無論是從HDD中進入SSD還是從DRAM中替換進入SSD都是小粒度的隨機寫,這就使得SSD的性能受到嚴重影響。?
第二,SSD壽命有限,它的壽命限制于擦除次數,而寫操作的數量直接決定擦除次數,然而在傳統的緩存概念中,無論什么樣的數據都要進入緩存,即使這些數據只被訪問一次,這些就會造成多余的擦除操作,會影響SSD的壽命。因此要盡量減少多余的寫操作。?
第三,SSD的容量有限,雖然較之于DRAM比較大,但是相對HDD和要存儲的數據量來講還是比較小的,因此應將使其存儲經常訪問的數據,這樣才能使其得到最大化的利用。?
從上面的敘述中可以看出,如何設計一個緩存系統與緩存管理策略,提高系統的性能,同時能使SSD的性能和空間得到最大化的利用是一個挑戰。傳統的緩存管理方式并不適合于應用到SSD中,它們主要分為以下幾類:?
第一類,是基于時間局部性的緩存管理算法。典型代表是LRU(Least?Recently?Used)算法,但是這種算法它不能鑒定數據訪問的熱度,數據即使只訪問過一次也從從鏈頭走到鏈尾才能被替換。?
第二類,是基于訪問頻率的緩存管理算法。典型代表是LFU(Least?Frequently?Used)算法。但是這種算法它不考慮時間這一因素,過去經常訪問但是已經很長時間不再被訪問的數據依然由于有很高的訪問頻繁而被保存在緩存中,因此會造成緩存污染。?
第三類,是綜合兩個因素的考慮,典型代表是LIRS(Low?Inter-Reference??Set)算法。但是它的缺點是實現較為復雜,同時會帶來一定的額外開銷。?
無論上面哪一類,它們都不能改善前面提到的問題,因為數據無論是進入SSD還是替換SSD,則必然產生對于SSD的小粒度的隨機寫,而且如果數據不加選擇的進入,緩存污染的問題在SSD上表現得更為嚴重。具體見附圖1.?
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210160350.5/2.html,轉載請聲明來源鉆瓜專利網。





