[發明專利]一種酶切概率輔助的肽段可檢測性預測方法有效
| 申請號: | 201810901107.1 | 申請日: | 2018-08-09 |
| 公開(公告)號: | CN109243527B | 公開(公告)日: | 2020-04-17 |
| 發明(設計)人: | 常乘;付巖;高志強;朱云平 | 申請(專利權)人: | 中國人民解放軍軍事科學院軍事醫學研究院;北京蛋白質組研究中心;中國科學院數學與系統科學研究院 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100850*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 概率 輔助 肽段可 檢測 預測 方法 | ||
本發明公開了一種酶切概率輔助的肽段可檢測性預測方法,其步驟包括:1)在所有鑒定蛋白中篩選高可信蛋白;2)構建酶切位點酶切概率預測模型訓練集;3)訓練酶切位點酶切概率預測模型;4)對所有高可信蛋白進行理論酶切,得到理論酶切肽段;5)預測所有理論酶切肽段的酶切概率;6)構建肽段可檢測性訓練集;7)訓練肽段可檢測性模型;8)預測其他蛋白的所有理論酶切肽段的肽段可檢測性。本發明根據鳥槍法蛋白質組學流程的特點,在肽段可檢測性預測過程中考慮的蛋白的酶解過程,顯著提高了肽段可檢測性預測的準確率。
技術領域
本發明涉及蛋白質組學中的肽段可檢測性預測方法,特別涉及鳥槍法蛋白質組學中的肽段可檢測性預測方法。
背景技術
靶向蛋白質組學實驗可以有選擇性的檢測和定量感興趣的肽段和蛋白,例如MRM實驗策略。該方法可以用于快速的驗證候選生物學標志物。開發MRM實驗的第一步就是為候選蛋白選擇代表肽段。選擇代表肽段的方法主要可以分為兩類:基于實驗數據的方法和基于計算的方法。但是基于實驗數據的方法有著一些限制。首先,并不是所有的蛋白都有已有的實驗數據。其次,肽段能否被檢測到受很多因素的影響,在之前的實驗中能被鑒定到,在下次實驗中不一定能被檢測到。因此,科研人員越來越關注基于計算的方法。但是,肽段檢測的機制仍不清楚,這阻礙了準確預測代表肽段的算法的開發。
到目前為止,科學家已經為探索肽段檢測的機制做了大量的努力。早在數年前,Le等人(參考文獻:Le Bihan,T.,Robinson,M.D.,Stewart,I.I.&Figeys,D.Definition andCharacterization of a“Trypsinosome”from Specific Peptide Characteristics byNano-HPLC-MS/MS and in Silico Analysis of Complex Protein Mixtures.J.ProteomeRes.3,1138–1148(2004).)和Eithier等人(參考文獻:Ethier,M.&Figeys,D.Strategy toDesign Improved Proteomic Experiments Based on Statistical Analyses of theChemical Properties of Identified Peptides.J.Proteome Res.4,2201–2206(2005).)提出了基于疏水性、肽段長度和等電點的經驗公式。近年來,科學家已經開發出了很多基于機器學習算法的預測代表肽段的方法。在這些方法中,設計描述肽段的特征是一個關鍵問題。眾所周知,影響一個肽段在蛋白質組學實驗中能否被檢測到的因素有很多,例如肽段的理化性質,肽段所屬的蛋白的豐度和鑒定流程等。Tang等人(參考文獻:Tang,H.et al.Acomputational approach toward label-free protein quantification usingpredicted peptide detectability.Bioinformatics 22,e481-8(2006).)提出了肽段可檢測性的概念,并使用來自于肽段序列的175種特征構建了預測肽段可檢測性的機器學習算法。后來,Sander等人(參考文獻:Sanders,W.S.,Bridges,S.M.,McCarthy,F.M.,Nanduri,B.&Burgess,S.C.Prediction of peptides observable by mass spectrometryapplied at the experimental set level.BMC Bioinformatics 8Suppl 7,S23(2007).),Mallick等人(參考文獻:Mallick,P.et al.Computational prediction ofproteotypic peptides for quantitative proteomics.Nat.Biotechnol.25,125–31(2007).)和Eyers等人(參考文獻:Eyers,C.E.et al.CONSeQuence:Prediction ofReference Peptides for Absolute Quantitative Proteomics Using ConsensusMachine Learning Approaches.Mol.Cell.Proteomics 10,M110.003384-M110.003384(2011).)分別基于596個特征,1010個特征和1186個特征開發了肽段可檢測性算法。這些算法主要考慮了來源于AAindex(參考文獻:Kawashima,S.,Ogata,H.&Kanehisa,M.AAindex:Amino acid index database.Nucleic Acids Res.27,368–369(1999).)和肽段序列的特征。最近,Muntel等人(參考文獻:Muntel,J.et al.Abundance-based classifier for theprediction of mass spectrometric peptide detectability upon enrichment(PPA).Mol Cell Proteomics 14,430–440(2015).)將蛋白豐度作為附加的特征加入到了肽段可檢測性預測模型中,并取得了更好的效果。但是,在未提前進行質譜實驗的情況下,蛋白豐度一般是未知的。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍軍事科學院軍事醫學研究院;北京蛋白質組研究中心;中國科學院數學與系統科學研究院,未經中國人民解放軍軍事科學院軍事醫學研究院;北京蛋白質組研究中心;中國科學院數學與系統科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810901107.1/2.html,轉載請聲明來源鉆瓜專利網。





