[發明專利]一種基于分布式存儲的數據傳輸校驗方法及系統有效
| 申請號: | 202110370802.1 | 申請日: | 2021-04-07 |
| 公開(公告)號: | CN113259410B | 公開(公告)日: | 2023-06-20 |
| 發明(設計)人: | 王盈;蔣德鈞;熊勁 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | H04L67/1097 | 分類號: | H04L67/1097;H04L1/00 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 分布式 存儲 數據傳輸 校驗 方法 系統 | ||
本發明提出一種基于分布式存儲的數據傳輸校驗方法和系統,包括:將寫入數據和該寫入數據對應的原始校驗碼發送至數據服務器;該數據服務器將該寫入數據存入存儲設備,使用該原始校驗碼檢查從該存儲設備中讀出的該寫入數據的正確性。檢查數據在整個操作路徑中出現的錯誤,保證了數據操作的可靠性。以及將大粒度訪問文件的校驗碼嵌入到文件數據塊索引中,將小粒度訪問文件的校驗碼嵌入到文件數據塊中,以降低校驗碼操作帶來的I/O開銷。
技術領域
本發明涉及分布式存儲技術領域,并特別涉及一種基于分布式存儲的數據傳輸校驗方法及系統。
背景技術
分布式文件系統被廣泛的用于提供數據存取服務。為了支持應用操作,目前已經有很多分布式文件系統,分別服務于HPC應用(如OrangeFS,XtreemFS和BeeGFS),服務于MapReduce應用(如GlusterFS)以及服務于云計算應用(如Ceph),服務于PolarDB數據庫(如PolarFS)。圖3展示了分布式文件系統架構。分布式文件系統包括客戶端(用戶態庫或者內核模塊)、元數據服務器和數據服務器。元數據服務器維護文件系統的名字空間并且記錄文件數據的存儲位置。數據服務器存儲文件數據。應用通過客戶端與數據服務器交互完成文件的讀寫操作。數據服務器經過分布式層協議(分布式層,例如保證分布式文件系統數據三副本一致性),最終由存儲后端引擎將數據存儲于存儲設備(如HDD,SSD和非易失性主內存NVMM)中,完成數據的存取操作。現有的分布式文件系統廣泛利用本地文件系統作為存儲后端引擎。
在數據的存取過程中,數據經過客戶端、通過網路傳輸給數據服務器,最后經過數據服務器的分布式層和存儲后端處理,存儲在存儲設備中。在這些過程中,分布式文件系統多使用校驗碼檢查數據的正確性,保證數據存取的可靠性。
校驗碼是存儲系統提供數據可靠性的重要手段,被廣泛的應用在分布式文件系統和本地文件系統中(包括本地文件系統和專用的存儲后端,如ceph的BlueStore)。在現有的分布式文件系統中,如HDFS,GFS以及百度的分布式文件系統,校驗碼被用于檢查數據在網絡傳輸和存儲設備中的錯誤。校驗碼的實現主要有如下一種方式:
技術方案:圖4展示了現有分布式文件系統執行寫操作時校驗碼的操作流程。客戶端在執行寫操作時,將數據和數據對應的校驗碼(CheckSum,CS)一起發送給數據服務器。在接收到請求后,數據服務器中的分布式層(例如HDFS和GFS)使用校驗碼檢查數據在網絡傳輸過程中的錯誤(第①步)。隨后,數據服務器將數據和校驗碼存儲在存儲設備中以便在隨后的操作中檢查數據的正確性。最常見的存儲校驗碼方法是給每個文件分配一個對應的校驗碼文件,記錄校驗碼值。如圖4所示,一個log文件會有一個對應的log.cs文件。為了方便管理,在存儲后端中記錄的校驗碼值通常都是按照固定的粒度,如每4KB數據記錄一個校驗碼值。由于寫請求的數據量和后端引擎中記錄校驗碼的粒度通常不同,例如寫請求的粒度為1KB而校驗碼是按照4KB數據粒度記錄的,分布式層通常需要重新計算校驗碼(第②步),然后通過存儲后端引擎將數據和新的校驗碼值寫入到存儲設備中(第③步)。
在執行讀操作時,分布式層首先檢查數據在本地存儲中是否出現錯誤。該過程需要讀取本地存儲設備中的數據,計算校驗碼并且和已經存儲的校驗碼值進行比較。一旦不相同,則數據出現錯誤。否則,分布式層對讀取的數據根據需要重新計算校驗碼。最后,分布式層將讀取的數據和對應的校驗碼值返回給客戶端。然而,現有的操作方式存在三個問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110370802.1/2.html,轉載請聲明來源鉆瓜專利網。





