[發明專利]一種基于圖數據庫的蛋白質組數據管理方法、介質和設備有效
| 申請號: | 202010816554.4 | 申請日: | 2020-08-14 |
| 公開(公告)號: | CN112116951B | 公開(公告)日: | 2023-04-07 |
| 發明(設計)人: | 范曉宣;曹華偉;葉笑春;范東睿 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G06F16/31;G06F16/901 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據庫 蛋白質 數據管理 方法 介質 設備 | ||
1.一種基于圖數據庫的蛋白質組數據管理方法,其特征在于,包括:
獲取蛋白質組對應的圖數據,圖數據包括多個節點和邊,其中,節點記錄其所代表的蛋白質,邊記錄其連接的兩個節點間的關系;
根據該蛋白質組對應的圖數據建立底層的雙向鏈表,該雙向鏈表中的節點按照其所代表蛋白質的名稱的字典序依次排列;
從底層的雙向鏈表開始,每兩個節點提取一個節點到上一層索引以在各索引層建立單向的索引鏈表,直至頂部的索引鏈表僅有兩個節點,以建立包括多層索引的快速索引;
在向建立有快速索引的蛋白質組對應的圖數據中插入新的蛋白質對應的節點時,生成一個用于決定該蛋白質組對應的圖數據的快速索引的更新方式的隨機變量,根據隨機變量所屬的不同數值范圍設置用于更新快速索引的不同更新方式,其包括:
在當前生成的隨機變量屬于第一數值范圍時,在底層的雙向鏈表中插入該新的蛋白質對應的節點,不更新快速索引;
在當前生成的隨機變量屬于第二數值范圍時,在底層的雙向鏈表中插入該新的蛋白質對應的節點,并在當前生成的隨機變量的數值以下層數的索引層中加入該插入的新的蛋白質對應的節點;
在當前生成的隨機變量屬于第三數值范圍時,在底層的雙向鏈表中插入該新的蛋白質對應的節點,在頂部新增一個索引層且在每個索引層中均加入該插入的新的蛋白質對應的節點,并且頂部的索引層從下一索引層中每兩個節點提取一個節點和該插入的新的蛋白質對應的節點共同構建單向鏈表。
2.根據權利要求1所述的基于圖數據庫的蛋白質組數據管理方法,其特征在于,所述方法包括:響應于圖數據庫中任意蛋白質組對應的圖數據達到預設規模的信號,為達到預設規模的蛋白質組在原始的倒排索引之外建立快速索引。
3.根據權利要求2所述的基于圖數據庫的蛋白質組數據管理方法,所述隨機變量服從參數為p的幾何分布,其中,所述p=0.5。
4.根據權利要求3所述的基于圖數據庫的蛋白質組數據管理方法,其特征在于,所述數值范圍包括:
第一數值范圍,其僅為數值1;
第二數值范圍(1,k+1];
第三數值范圍(k+1,+∞),k表示當前快速索引中索引層的總層數。
5.根據權利要求1所述的基于圖數據庫的蛋白質組數據管理方法,其特征在于,所述方法還包括:
響應于刪除建立有快速索引的蛋白質組對應的圖數據中的某個待刪除蛋白質對應的節點的請求,從多層索引的頂層依次向下查找并刪除每個索引層中的該待刪除蛋白質對應的節點后,刪除底層的雙向鏈表中的該待刪除蛋白質對應的節點。
6.根據權利要求1至5任一項所述的基于圖數據庫的蛋白質組數據管理方法,所述方法還包括:
為建立有快速索引的蛋白質組對應的圖數據中的每個蛋白質對應的節點建立一個用于記錄節點間的關系的哈希表,根據預先設計的哈希函數基于該節點的各鄰居節點所代表的蛋白質的名稱計算各鄰居節點在哈希表中的存儲位置,并將各鄰居節點所代表的蛋白質的名稱分別存儲在計算得到的存儲位置。
7.根據權利要求6所述的基于圖數據庫的蛋白質組數據管理方法,其特征在于,所述哈希函數為:
其中,x表示蛋白質的名稱,N表示蛋白質的名稱的字符串長度,xn表示蛋白質的名稱的第n位的字符,ASCII(xn-A)表示蛋白質的名稱的第n位字符的ASCII碼與字符A的ASCII碼之差,MOD表示取模,prime表示模。
8.一種計算機可讀存儲介質,其特征在于,其上包含有計算機程序,所述計算機程序可被處理器執行以實現權利要求1至7中任一項所述方法的步驟。
9.一種電子設備,其特征在于,包括:
一個或多個處理器;以及
存儲器,其中存儲器用于存儲一個或多個可執行指令;
所述一個或多個處理器被配置為經由執行所述一個或多個可執行指令以實現權利要求1至7中任一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010816554.4/1.html,轉載請聲明來源鉆瓜專利網。





