[發明專利]一種蛋白質翻譯后修飾的定位方法及系統有效
| 申請號: | 201410360277.5 | 申請日: | 2014-07-25 |
| 公開(公告)號: | CN104134015B | 公開(公告)日: | 2017-05-03 |
| 發明(設計)人: | 羅蘭;孫瑞祥;遲浩;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06F19/10 | 分類號: | G06F19/10 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 蛋白質 翻譯 修飾 定位 方法 系統 | ||
1.一種蛋白質翻譯后修飾的定位方法,包括:
步驟1)、對于一條蛋白質序列,計算發生的修飾的總質量,得到該總質量對應的一個或多個修飾組合;
步驟2)、將與所述蛋白質序列上的每個氨基酸對應的一個或多個修飾集合作為有向無環圖中的頂點,根據所述一個或多個修飾組合連接該頂點,并且根據與所述蛋白質序列對應的譜圖設置該頂點的權值;其中,所述修飾集合是從所述蛋白質序列的第一個氨基酸到對應的氨基酸上能夠發生的修飾的集合并且是所述一個或多個修飾組合中的一個修飾組合的子集;
步驟3)、根據路徑上所有頂點的權值選擇所述有向無環圖中的路徑,并且將該路徑轉換為修飾位點信息;
在所述步驟2)中,按照以下步驟連接有向無環圖中的頂點:
對于相鄰的氨基酸對應的兩個修飾集合B、B’,其中B’是后一個氨基酸對應的修飾集合,如果B=B’,則在所述有向無環圖中建立從B對應的頂點到B’對應的頂點的有向邊;或者
如果B’=B∪{x},并且修飾x屬于所述一個或多個修飾組合并且能夠發生在B’對應的氨基酸上,則在所述有向無環圖中建立從B對應的頂點到B’對應的頂點的有向邊。
2.根據權利要求1所述的方法,在步驟2)中,根據頂點對應的蛋白質的N端和C端離子與譜圖中譜峰的匹配結果設置該頂點的權值。
3.根據權利要求2所述的方法,其中,按照以下步驟設置頂點的權值:
步驟A)、根據與所述蛋白質序列對應的譜圖中譜峰的質量建立哈希表M,以及計算所述頂點對應的蛋白質的N端和C端離子的質量并且向下取整;其中,哈希表M中的第i個元素表示質量為i,其元素值表示質量為i的譜峰的編號;
步驟B)、對于取整后的N端和C端離子的質量,查詢與其中每個質量匹配的譜峰;其中,查找與一個質量m匹配的譜峰包括:
查詢哈希表M得到第m個元素和第m+1個元素所對應的譜峰的編號M[m]和M[m+1],如果在M[m]和M[m+1]之間存在質量在m的允許誤差范圍內的譜峰,則質量m有匹配上的譜峰;
步驟C)、如果取整后的N端和C端離子的質量均有匹配上的譜峰,則將所述頂點的權值設置為2;如果取整后的N端和C端離子的質量的其中一個有匹配上的譜峰,則將所述頂點的權值設置為1;否則設置為0。
4.根據權利要求3所述的方法,其中,按照以下步驟建立哈希表M:
步驟a)、為哈希表M分配預定空間;
步驟b)、依次讀入與所述蛋白質序列對應的譜圖中的每個譜峰,將該譜峰的質量向下取整為n,如果哈希表M中的第n個元素為空則將該譜峰的編號寫入第n個元素;
步驟c)、當所有譜峰讀入完畢,將哈希表M中為空的元素寫入前一元素的值。
5.根據權利要求3或4所述的方法,其中,步驟3)包括:
選擇路徑上所有頂點的權值之和較大的前k條路徑。
6.根據權利要求1所述的方法,在步驟3)中,按照以下步驟將所選擇的路徑轉換為修飾位點信息:
從所選擇的路徑的起點開始遍歷,如果相鄰頂點中后一個頂點對應的修飾集合B’比前一個頂點對應的修飾集合B多一個修飾,則與修飾集合B’對應的氨基酸上發生了該修飾,將該修飾與修飾位點對加入該路徑的修飾位點信息。
7.根據權利要求1所述的方法,其中,所述修飾集合包括空集。
8.根據權利要求1所述的方法,其中,步驟1)之前還包括:
根據用戶指定的修飾,建立修飾組合與該修飾組合的質量的索引表;其中所述修飾組合中的修飾數目小于預定數目且所述修飾組合的質量小于預定質量。
9.根據權利要求8所述的方法,其中,步驟1)包括:
步驟11)、根據所述蛋白質序列的每個氨基酸殘基的質量計算蛋白質的理論質量;并且根據與所述蛋白質序列對應的譜圖計算該譜圖的母離子質量;
步驟12)、將所述母離子質量與所述理論質量的差值作為發生的修飾的總質量;
步驟13)、查詢索引表得到該總質量對應的一個或多個修飾組合。
10.根據權利要求1所述的方法,還包括:
步驟4)、根據所述修飾位點信息與所述蛋白質序列構成候選蛋白質變體,根據候選蛋白質變體與所述譜圖的匹配程度選擇一個蛋白質變體。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410360277.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





