[發(fā)明專利]一種適用于海量存儲(chǔ)系統(tǒng)的重復(fù)數(shù)據(jù)刪除方法無效
| 申請(qǐng)?zhí)枺?/td> | 201210452830.9 | 申請(qǐng)日: | 2012-11-13 |
| 公開(公告)號(hào): | CN102982122A | 公開(公告)日: | 2013-03-20 |
| 發(fā)明(設(shè)計(jì))人: | 梁吉林 | 申請(qǐng)(專利權(quán))人: | 浪潮電子信息產(chǎn)業(yè)股份有限公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30;G06F3/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250014 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 適用于 海量 存儲(chǔ)系統(tǒng) 重復(fù) 數(shù)據(jù) 刪除 方法 | ||
1.一種適用于海量存儲(chǔ)系統(tǒng)的重復(fù)數(shù)據(jù)刪除方法,?其特征在于使用4KB-8KB的塊大小對(duì)數(shù)據(jù)流進(jìn)行分塊,這樣極小的塊就能夠確保極高的重復(fù)數(shù)據(jù)刪除率,能夠較精確的進(jìn)行重復(fù)數(shù)據(jù)的定位刪除;而針對(duì)HDD磁盤與內(nèi)存RAM之間數(shù)據(jù)傳輸率的差異而導(dǎo)致的性能影響,通過使用SSD重新構(gòu)建存儲(chǔ)的架構(gòu),作為RAM與RAID陣列之間的中轉(zhuǎn),這樣不僅能夠提高檢索的速率,而且也提高了數(shù)據(jù)的存儲(chǔ)速率,在新的數(shù)據(jù)塊Hash值到來需要進(jìn)行驗(yàn)證的時(shí)候,RAM讀取存儲(chǔ)在SSD中的Hash索引,以SSD比HDD高出3倍的實(shí)際數(shù)據(jù)傳輸速率,便得系統(tǒng)的性能得到保證,使用4KB-8KB的小塊所產(chǎn)生的相對(duì)較大的Hash索引表所引起的性能問題也能夠得到解決,針對(duì)重復(fù)數(shù)據(jù)刪除比以及重復(fù)數(shù)據(jù)刪除精確度低的問題,使用Hash值和數(shù)據(jù)指紋的雙重校驗(yàn),以確保最大程度上的重復(fù)數(shù)據(jù)刪除精確度,因?yàn)槭褂肧SD作為中間點(diǎn),保障了I/O速率,因此在雙重驗(yàn)證的情況下,也不會(huì)影響系統(tǒng)的性能,具體步驟如下:
1)接收到所要進(jìn)行存儲(chǔ)的數(shù)據(jù)流;
2)傳送至Dedupe?System模塊;
3)數(shù)據(jù)流按照指定的4KB-8KB大小的塊進(jìn)行截?cái)喾纸猓?/p>
4)計(jì)算數(shù)據(jù)塊的Hash值;
5)計(jì)算數(shù)據(jù)塊的數(shù)據(jù)指紋;
6)讀取SSD中存儲(chǔ)的Hash索引表;
7)判別Hash值與Hash索引表中是否重復(fù);
A.重復(fù),(1)讀取數(shù)據(jù)指紋索引表,繼續(xù)判定數(shù)據(jù)指紋;(2)數(shù)據(jù)指紋重復(fù),建立數(shù)據(jù)連接,數(shù)據(jù)塊不進(jìn)行存儲(chǔ);(3)數(shù)據(jù)指紋不重復(fù),存儲(chǔ)數(shù)據(jù)塊到SSD,存儲(chǔ)數(shù)據(jù)塊Hash值至SSD中的Hash索引表,存儲(chǔ)數(shù)據(jù)塊的數(shù)據(jù)指紋至SSD中的數(shù)據(jù)指紋索引表;
B.不重復(fù),(1)存儲(chǔ)數(shù)據(jù)塊至SSD,存儲(chǔ)數(shù)據(jù)塊Hash值至SSD中的Hash索引表,存儲(chǔ)數(shù)據(jù)塊的數(shù)據(jù)指紋至SSD中的數(shù)據(jù)指紋索引表;(2)將存儲(chǔ)于SSD中的數(shù)據(jù)塊傳送到RAID陣列磁盤中進(jìn)行存儲(chǔ)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浪潮電子信息產(chǎn)業(yè)股份有限公司,未經(jīng)浪潮電子信息產(chǎn)業(yè)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210452830.9/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:耐候鋼板材的焊接方法
- 下一篇:定子長銷孔拉床
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 一種數(shù)據(jù)庫海量數(shù)據(jù)比對(duì)的方法
- 基于云計(jì)算的海量數(shù)據(jù)訪問處理系統(tǒng)
- 一種實(shí)現(xiàn)海量數(shù)據(jù)離線分析的方法
- 一種海量矢量切片數(shù)據(jù)云存儲(chǔ)方法及系統(tǒng)
- 一種多源海量數(shù)據(jù)處理系統(tǒng)及方法
- 快速實(shí)現(xiàn)海量數(shù)據(jù)準(zhǔn)實(shí)時(shí)全量統(tǒng)計(jì)的方法、裝置及系統(tǒng)
- 一種海量數(shù)據(jù)分析系統(tǒng)及方法
- 在線繪制地圖海量線的方法
- 一種海量點(diǎn)數(shù)據(jù)聚合渲染方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種海量不確定XML數(shù)據(jù)存儲(chǔ)方法
- 用于處理到遠(yuǎn)程存儲(chǔ)位置的故障恢復(fù)的方法、系統(tǒng)以及程序
- 包括向外擴(kuò)展型存儲(chǔ)系統(tǒng)的存儲(chǔ)系統(tǒng)群及其管理方法
- 一種移動(dòng)存儲(chǔ)系統(tǒng)及其存儲(chǔ)方法
- 存儲(chǔ)系統(tǒng)的數(shù)據(jù)備份與恢復(fù)系統(tǒng)、方法、設(shè)備及存儲(chǔ)介質(zhì)
- 在線遷移異構(gòu)系統(tǒng)數(shù)據(jù)的方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 建立存儲(chǔ)系統(tǒng)伙伴關(guān)系的方法及裝置
- 數(shù)據(jù)處理系統(tǒng)及其操作方法
- 一種容災(zāi)平臺(tái)及一種容災(zāi)方法
- 在基于云的存儲(chǔ)系統(tǒng)中服務(wù)I/O操作
- 一種數(shù)據(jù)修復(fù)方法及裝置





