[發明專利]譜庫的生成方法和串聯質譜譜圖鑒定方法有效
| 申請號: | 201010208640.3 | 申請日: | 2010-06-13 |
| 公開(公告)號: | CN101871945A | 公開(公告)日: | 2010-10-27 |
| 發明(設計)人: | 葉叮;付巖;孫瑞祥;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G01N33/68 | 分類號: | G01N33/68;G01N27/62 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 生成 方法 串聯 質譜譜 圖鑒 | ||
1.一種譜圖數據庫的生成方法,包括:
步驟1)、選取已解析的實驗串聯質譜譜圖,所述已解析的串聯質譜譜圖中包括母離子肽序列、電荷、修飾類型和位點在內的信息;
步驟2)、從所述已解析的實驗串聯質譜譜圖中去除冗余譜圖,得到代表譜;
步驟3)、將所述代表譜所對應的母離子肽序列按理論碎裂模式進行劃分,得到與所述代表譜相對應的理論譜;
步驟4)、合并所述代表譜與所對應的理論譜,得到優化譜;
步驟5)、對所述優化譜做譜峰標注,由譜峰標注后的優化譜生成譜圖數據庫。
2.根據權利要求1所述的譜圖數據庫的生成方法,其特征在于,還包括:
步驟6)、對保存在譜圖數據庫中的優化譜做譜峰處理,去除譜峰中的干擾信息,保留并調整有用的信息。
3.根據權利要求1或2所述的譜圖數據庫的生成方法,其特征在于,還包括:
步驟7)、重排所述優化譜的母離子肽序列,根據重排后的母離子肽序列生成誘餌譜,將所述誘餌譜保存在譜圖數據庫中。
4.根據權利要求1或2或3所述的譜圖數據庫的生成方法,其特征在于,所述的步驟2)包括:
步驟2-1)、從所述已解析的實驗串聯質譜譜圖中選出冗余譜圖;所述冗余譜圖為具有相同母離子肽序列、電荷、修飾類型和位點的譜圖;
步驟2-2)、對所述冗余譜圖做譜峰歸一化,將譜圖中每根譜峰的強度值改為該譜峰原始強度值與該譜圖內強度最高譜峰的原始強度值之間的比值;
步驟2-3)、為各張所述冗余譜圖賦予權重;
步驟2-4)、合并所述的冗余譜圖。
5.一種串聯質譜譜圖鑒定方法,包括:
步驟1)、輸入待解析的串聯質譜譜圖,所述待解析的串聯質譜譜圖中已包含有該譜圖的母離子質量和電荷,以及各譜峰的質荷比和強度;
步驟2)、從由權利要求1-4之一所得到的譜圖數據庫中為所述待解析的串聯質譜譜圖找出候選譜,所述候選譜與待解析的串聯質譜譜圖的母離子電荷相同且質量誤差在第一閾值范圍內;所述第一閾值的范圍大于常見蛋白質翻譯后修飾的質量范圍;
步驟3)、將待解析的串聯質譜譜圖與所述候選譜中的各個譜圖做匹配打分,根據匹配打分結果找出匹配度最高的候選譜作為鑒定結果。
6.根據權利要求5所述的串聯質譜譜圖鑒定方法,其特征在于,所述譜圖數據庫還包括誘餌譜圖,所述誘餌譜圖為預期作為錯誤鑒定結果的譜圖;所述方法還包括:
步驟4)、根據待解析的串聯質譜譜圖鑒定結果來自所述優化譜和所述誘餌譜的數量,對鑒定結果進行整體上的假陽率評估。
7.根據權利要求5或6所述的串聯質譜譜圖鑒定方法,其特征在于,所述步驟3)包括:
步驟3-1)、依次分析待解析的串聯質譜譜圖中的每一根譜峰,從所述候選譜中查找與其匹配的譜峰;在查找匹配譜峰的過程中要考慮由潛在修飾引入的部分譜峰質荷比的改變;
步驟3-2)、在確定待解析的串聯質譜譜圖與所述候選譜所匹配的譜峰后,根據譜峰的匹配情況分別計算用于衡量某一候選譜與某一待解析串聯質譜譜圖間相似性的相似性分數,以及用于衡量某一候選譜與某一待解析串聯質譜譜圖的匹配情況相對于其它候選譜是否顯著的顯著性分數;
步驟3-3)、根據所述的相似性分數與顯著性分數計算匹配得分,選擇匹配得分最高的候選譜作為鑒定結果。
8.根據權利要求7所述的串聯質譜譜圖鑒定方法,其特征在于,所述相似性分數的計算公式如下:
其中,IQ和IL分別表示所涉及到的待解析譜和候選譜的譜峰強度。
9.根據權利要求7所述的串聯質譜譜圖鑒定方法,其特征在于,對所述顯著性分數的計算如下:
步驟a)、定義待解析譜圖中強度排名前n的譜峰為主力譜峰,定義發生在一根主力譜峰和一根被標注譜峰之間的譜峰匹配叫做有力的匹配,設mi為第i張候選譜圖中被標注的譜峰個數,設ki為待解析譜圖和第i張候選譜圖匹配時發生的有力的匹配次數;
步驟b)、當該待解析譜圖與這W張候選譜圖匹配時,某一根主力譜峰與某一根被標注譜峰匹配上的概率p為:
步驟c)、對于該待解析譜中的某一根主力譜峰與第i張譜圖中的譜峰進行匹配時,發生有力的匹配的概率P為:
步驟d)、該待解析譜與第i張候選譜圖進行譜峰匹配時,發生不少于ki次有力匹配的概率p_value為:
步驟e)、所述顯著性分數為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010208640.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可保護血管壁的內瘺針
- 下一篇:播放實景電影的多屏幕裝置





