[發明專利]一種基于子集錯誤率估計的肽鑒定方法有效
| 申請號: | 201310375508.5 | 申請日: | 2013-08-26 |
| 公開(公告)號: | CN103439441A | 公開(公告)日: | 2013-12-11 |
| 發明(設計)人: | 付巖 | 申請(專利權)人: | 中國科學院數學與系統科學研究院 |
| 主分類號: | G01N30/86 | 分類號: | G01N30/86;G01N30/72 |
| 代理公司: | 北京君尚知識產權代理事務所(普通合伙) 11200 | 代理人: | 余長江 |
| 地址: | 100190 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 子集 錯誤率 估計 鑒定 方法 | ||
技術領域
本發明屬于蛋白質分析技術領域,具體涉及一種基于子集錯誤率估計的肽鑒定方法。
背景技術
眾所周知,絕大多數生物的遺傳信息保存在DNA中。DNA通過轉錄過程生成信使RNA,而信使RNA又通過翻譯過程生成蛋白質,從而實現了遺傳信息由DNA到RNA再到蛋白質的傳遞,這一過程也被稱為生命的中心法則。在從RNA翻譯生成蛋白質的過程中,20種氨基酸以肽鍵順序相連所形成的鏈狀分子被稱為肽,而其中分子量達到一定級別的肽則被稱為蛋白質。大多數蛋白質在翻譯形成后,會在蛋白質中的某些氨基酸上增加某種功能團(如在蛋白質的N末端加入乙酰),或增加了其他的蛋白質或肽,或改變了氨基酸的化學性質或結構,這一過程被稱為發生了化學修飾,由于該過程發生在前述的翻譯過程后,因此在蛋白質氨基酸上所發生的變化也被稱為蛋白質翻譯后修飾。
液相色譜與質譜儀聯用,并結合數據庫搜索計算是目前蛋白質組學中鑒定蛋白質及其翻譯后修飾的常用方法。在這種方法中,通過液相色譜與質譜儀聯用可以得到蛋白質樣品的實驗串聯質譜。實驗串聯質譜的獲取過程包括:蛋白質樣品首先被選定的蛋白酶水解,形成肽混合物;肽混合物通過液相色譜進行分離,不同物理化學性質的肽先后從色譜柱中流出;從色譜柱中流出的肽不斷進入質譜儀;肽在質譜儀中被離子化,具有特定質量電荷比的肽離子在能量作用下碎裂形成碎片離子,碎片離子被分離和檢測形成肽碎片離子譜;通過以上過程便得到蛋白質的實驗串聯質譜。在得到實驗串聯質譜后就可以從實驗串聯質譜中鑒定肽的氨基酸序列,進而鑒定蛋白質。
從實驗串聯質譜中鑒定肽的氨基酸序列時通常采用數據庫搜索計算的方法。在計算過程中,數據庫中所保存的蛋白質序列被模擬水解成候選肽,然后再將候選肽理論碎裂,生成理論串聯質譜;將模擬計算得到的多個理論串聯質譜依次與前述液相色譜與質譜儀聯用所得到的實驗串聯質譜相比較,根據相似度進行打分,得分最高的理論質譜對應的肽就是實驗質譜的鑒定結果。如果生成實驗串聯質譜的肽序列存在于數據庫中的話,就可能將其鑒定出來。為了鑒定發生翻譯后修飾的蛋白質,一種常見的基于串聯質譜的鑒定方法是在數據庫搜索時指定一些可變修飾類型,然后在生成候選肽時同時考慮發生和不發生指定修飾的情況,當候選肽中有多個可能的修飾位點時考慮所有可能的組合。
在基于質譜的蛋白質組學研究中,一次蛋白質組質譜實驗通常能夠產生數千至百萬規模的串聯質譜。通過數據庫搜索鑒定這些質譜圖,就產生了數目巨大的有待確認的肽鑒定結果。然而,由于譜圖信號差、存在未知修飾、以及打分算法的缺陷等原因,這些結果的一部分(往往是大部分)是不正確的。所以,需要根據鑒定分值對鑒定結果進行過濾以及FDR(False?Discovery?Rate,中文可翻譯為假發現率或者錯誤發現率,參見參考文獻:Benjamini,Y.and?Y.Hochberg,Controlling?the?false?discovery?rate:a?practical?and?powerful?approach?to?multiple?testing.Journal?of?the?Royal?Statistical?Society,Series?B(Methodological),1995.57(1):p.289-300.)的估計和控制。目前最常用和有效的肽鑒定FDR估計方法是目標-誘餌庫搜索方法(參見文獻:Elias,J.E.and?S.P.Gygi,Target-decoy?search?strategy?for?increased?confidence?in?large-scale?protein?identifications?by?mass?spectrometry.Nat?Methods,2007.4(3):p.207-14.)。在這種方法中,通過搜索誘餌蛋白質序列(如目標庫的反序列構成的數據庫)來獲得錯誤的鑒定,而FDR就用分值閾值之上的誘餌肽鑒定數量除以目標肽鑒定數量來估計。當鑒定數量較大時,這種目標-誘餌庫搜索方法可以有效的估計肽鑒定FDR。但是如果鑒定數量較少的話,這種FDR估計方法就不準確了(參見文獻:Huttlin,E.L.,et?al.,Prediction?of?error?associated?with?false-positive?rate?determination?for?peptide?identification?in?large-scale?proteomics?experiments?using?a?combined?reverse?and?forward?peptide?sequence?database?strategy.J?Proteome?Res,2007.6(1):p.392-8.)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院數學與系統科學研究院,未經中國科學院數學與系統科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310375508.5/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:單核增生李斯特氏菌富集和快速檢測方法
- 下一篇:一種菌影載體的構建方法





