[發明專利]數據分區存儲方法及裝置在審
| 申請號: | 202011187097.3 | 申請日: | 2020-10-29 |
| 公開(公告)號: | CN112233727A | 公開(公告)日: | 2021-01-15 |
| 發明(設計)人: | 孫成全;李雷;曹銀川;成崗;劉冰;吳俊;李瑞強 | 申請(專利權)人: | 北京諾禾致源科技股份有限公司 |
| 主分類號: | G16B50/30 | 分類號: | G16B50/30;G16B20/30;G16B20/50 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 周春枚 |
| 地址: | 102200 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 分區 存儲 方法 裝置 | ||
1.一種數據分區存儲方法,其特征在于,包括:
在預定數據倉庫中初始化存儲基因突變位點的分區表;
根據多個基因突變位點中每一個基因突變位點對應的數據區間將所述分區表分為多個子區域;
獲取待存儲的目標基因突變位點的起點數值和終點數值;
基于所述目標基因突變位點的起點數值和終點數據將所述目標基因突變位點匹配并存儲到所述分區表的一個或多個子區域中。
2.根據權利要求1所述的方法,其特征在于,在在預定數據倉庫中初始化存儲基因突變位點的分區表之前,還包括:
搭建基于Hadoop的大數據平臺,其中,所述基于Hadoop的大數據平臺至少包括:預定數據倉庫,計算引擎,查詢系統。
3.根據權利要求1所述的方法,其特征在于,在在預定數據倉庫中初始化存儲基因突變位點的分區表之后,還包括:
獲取多個歷史基因突變位點的起點位置和終點數值;
基于所述多個歷史基因突變位點的起點位置和終點位置將所述多個歷史基因突變位點存儲至所述分區表。
4.根據權利要求1所述的方法,其特征在于,在在預定數據倉庫中初始化存儲基因突變位點的分區表之后,還包括:
獲取基因組中每條染色體的長度信息;
基于所述每條染色體的長度信息將所述染色體的標號以及長度信息轉換成預定格式的數據結構。
5.根據權利要求1所述的方法,其特征在于,獲取待存儲的目標基因突變位點的起點數值和終點數值,包括:
獲取與所述目標基因突變位點對應的基因組版本的基因組注釋文件;
通過所述基因組注釋文件提取出所述目標基因突變位點的位置信息;
基于所述目標基因突變位點的位置信息確定所述目標基因突變位點的起點數值和終點數值。
6.根據權利要求1至5中任一項所述的方法,其特征在于,在基于所述目標基因突變位點的起點數值和終點數據將所述目標基因突變位點匹配并存儲到所述分區表的一個或多個子區域中之后,還包括:
將所述目標基因突變位點的變異信息以及分區信息存儲到所述分區表的預定區域中。
7.一種數據分區存儲裝置,其特征在于,包括:
初始化單元,用于在預定數據倉庫中初始化存儲基因突變位點的分區表;
劃分單元,用于根據多個基因突變位點中每一個基因突變位點對應的數據區間將所述分區表分為多個子區域;
第一獲取單元,用于獲取待存儲的目標基因突變位點的起點數值和終點數值;
存儲單元,用于基于所述目標基因突變位點的起點數值和終點數據將所述目標基因突變位點匹配并存儲到所述分區表的一個或多個子區域中。
8.根據權利要求7所述的裝置,其特征在于,還包括:
搭建單元,用于在在預定數據倉庫中初始化存儲基因突變位點的分區表之前,搭建基于Hadoop的大數據平臺,其中,所述基于Hadoop的大數據平臺至少包括:預定數據倉庫,計算引擎,查詢系統。
9.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質包括存儲的計算機程序,其中,在所述計算機程序被處理器運行時控制所述計算機存儲介質所在設備執行權利要求1至6中任意一項所述的數據分區存儲方法。
10.一種處理器,其特征在于,所述處理器用于運行計算機程序,其中,所述計算機程序運行時執行權利要求1至6中任意一項所述的數據分區存儲方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京諾禾致源科技股份有限公司,未經北京諾禾致源科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011187097.3/1.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





