[發明專利]重復數據刪除方法和存儲陣列有效
| 申請號: | 201480001884.0 | 申請日: | 2014-09-15 |
| 公開(公告)號: | CN105612489B | 公開(公告)日: | 2017-08-29 |
| 發明(設計)人: | 張巍;呂先紅;魏明昌;張陳怡 | 申請(專利權)人: | 華為技術有限公司 |
| 主分類號: | G06F3/06 | 分類號: | G06F3/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 重復 數據 刪除 方法 存儲 陣列 | ||
技術領域
本發明涉及信息技術領域,尤其涉及一種重復數據刪除方法和存儲陣列。
背景技術
存儲陣列,一般包括一個引擎,一個引擎中包括兩個控制器,通常稱為雙控制器結構。如圖1所示,存儲陣列包括輸入輸出管理器A和輸入輸出管理器B,控制器A和控制器B。輸入輸出管理器A與控制器A連接,輸入輸出管理器B與控制B連接。控制器A包括外圍組件快速互聯(Peripheral Component Interconnect express,PCIe)交換A、中央處理單元(Central Processing Unit,CPU)A和內存A;控制器B包括外圍組件快速互聯(Peripheral Component Interconnect express,PCIe)交換B、中央處理單元(Central Processing Unit,CPU)B和內存B。PCIe交換A與PCIe交換B連接。在圖1所示的存儲陣列中,在將待寫入數據寫入到硬盤之前,進行重復數據刪除。具體過程:控制器A的CPU A將內存A中待寫入數據分塊得到多個數據塊,并且計算每一個數據塊的特征值,通過查找控制器A的特征值索引集合中的特征值,判斷是否為重復數據塊,如果是重復數據塊,則將該數據塊刪除;如果不是重復數據塊,則將該數據塊寫入硬盤。
上述存儲陣列重復數據刪除過程,消耗了控制器的CPU的計算能力和控制器的內存資源,嚴重影響了存儲陣列的性能。
發明內容
本發明實施例提供了一種重復數據刪除方法和存儲陣列。
第一方面,本發明實施例提供了一種重復數據刪除方法,所述方法應用于存儲陣列,所述存儲陣列包括交換設備、第一控制器和緩存設備;其中所述第一控制器與所述交換設備連接;所述緩存設備與所述交換設備連接;所述交換設備與所述存儲陣列中的硬盤連接;所述方法包括:
所述第一控制器從所述緩存設備接收待重刪數據塊的特征值,在數據塊特征值索引集合查找所述待重刪數據塊的特征值;;
當在所述數據塊特征值索引集合中沒有查找到所述待重刪數據塊的特征值時,所述第一控制器,通過所述交換設備,獲取所述待重刪數據塊在所述緩存設備中的緩存地址;
所述第一控制器,通過所述交換設備,向目標硬盤的控制器發送數據讀取指令;所述數據讀取指令攜帶所述緩存設備的標識和所述緩存地址;
所述目標硬盤的控制器根據所述緩存設備的標識和所述緩存地址,通過所述交換設備,從所述緩存地址中讀取所述待重刪數據塊;
所述目標硬盤的控制器將所述待重刪數據塊存儲到所述目標硬盤。
結合本發明第一方面,第一種可能的實施方式中,所述方法還包括:
所述目標硬盤的控制器,通過所述交換設備,向所述第一控制器發送目標硬盤存儲地址;所述目標硬盤存儲地址包括所述目標硬盤的控制器標識和所述目標硬盤中存儲所述待重刪數據塊的邏輯存儲地址;
所述第一控制器在所述數據塊特征值索引集合中建立所述待重刪數據塊的特征值索引;所述待重刪數據塊的特征值索引包括所述待重刪數據塊的特征值和所述目標硬盤存儲地址。
結合本發明第一方面,第二種可能的實施方式中,所述存儲陣列還包括第二控制器,所述第二控制器與所述交換設備連接;所述第二控制器存儲所述待重刪數據塊地址,所述第二控制器為所述待重刪數據塊所在的目標邏輯單元的歸屬控制器;則所述第一控制器從所述緩存設備接收待重刪數據塊的特征值,具體包括:
所述緩存設備通過所述交換設備,向所述第二控制器發送所述待重刪數據塊的特征值;
所述第二控制器確定所述待重刪數據塊的特征值的歸屬控制器為所述第一控制器;
所述第二控制器,通過所述交換設備,向所述第一控制器發送所述待重刪數據塊的特征值。
結合本發明第一方面的第二種可能的實施方式,第三種可能的實施方式中,在所述數據塊特征值索引集合中沒有查找到所述待重刪數據塊的特征值時,所述方法還包括:所述第一控制器,通過所述交換設備,向所述第二控制器發送通知,所述通知中攜帶所述目標硬盤存儲地址;
所述第二控制器根據所述通知,建立所述待重刪數據塊地址、所述待重刪數據塊的特征值和所述目標硬盤存儲地址的對應關系。
結合本發明第一方面的第二種可能的實施方式,第四種可能的實施方式中,所述方法還包括:所述第二控制器建立所述待重刪數據塊地址、所述待重刪數據塊的特征值與所述第一控制器地址的對應關系。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華為技術有限公司,未經華為技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201480001884.0/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





