[發明專利]面向基因測序大數據的云存儲方法在審
| 申請號: | 201810314885.0 | 申請日: | 2018-04-10 |
| 公開(公告)號: | CN108650298A | 公開(公告)日: | 2018-10-12 |
| 發明(設計)人: | 劉輝 | 申請(專利權)人: | 常州大學 |
| 主分類號: | H04L29/08 | 分類號: | H04L29/08;G06F19/28;G06F19/22 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 213164 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 大數據 基因測序 云存儲 副本 分布式文件系統 高通量測序 并發訪問 存儲模式 存儲容量 訪問頻率 分析過程 橫向擴展 數據文件 可用性 客戶端 條塊 保存 | ||
1.一種面向基因測序大數據的云存儲方法,其特征在于:包括以下步驟:
首先,根據數據文件的特點對基因測序大數據進行分類,然后根據分類結果選擇存儲策略的類型,將基因測序大數據上傳到云存儲服務器的各個存儲節點進行存儲;
其中,針對單個文件大、并發性能要求高、訪問頻率高以及可訪問性要求高的數據文件采用條塊化多副本存儲策略;針對單個文件大、并發訪問頻率低、數據可用性要求高以及數據規模大的數據文件采用分布式多副本存儲策略;針對文件數量大、整體容量大、但大多數文件較小、訪問頻率低以及數據可用性要求低的數據文件采用分布式單副本存儲策略;
不同存儲策略的存儲過程為,
條塊化多副本存儲策略:將單個大文件分割成若干數據塊,每個數據塊保存在不同存儲節點上,提高并發訪問性能;每個數據塊都存儲在至少三個不同存儲節點上,以提高數據可用性;
分布式多副本存儲策略:構建分布式集群擴展存儲空間以保存海量數據,每個文件在至少兩個不同存儲節點保存完整副本,提高數據可用性;
分布式單副本存儲策略:構建分布式集群擴展存儲空間以存儲海量數據,每個文件只在一個節點上保存完整副本。
2.如權利要求1所述的面向基因測序大數據的云存儲方法,其特征在于:上傳數據文件至云存儲服務器時,將文件名、文件大小以及存儲路徑保存至關系數據庫中;檢索數據文件時只需從關系數據庫中讀取對應的記錄即可,從而加快數據檢索速度;從客戶端下載數據文件時,先從關系數據庫中讀取該文件的存儲路徑,再從云存儲服務器中讀取文件內容發送給客戶端。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于常州大學,未經常州大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810314885.0/1.html,轉載請聲明來源鉆瓜專利網。





