[發(fā)明專利]一種酶切概率輔助的肽段可檢測性預測方法有效
| 申請?zhí)枺?/td> | 201810901107.1 | 申請日: | 2018-08-09 |
| 公開(公告)號: | CN109243527B | 公開(公告)日: | 2020-04-17 |
| 發(fā)明(設(shè)計)人: | 常乘;付巖;高志強;朱云平 | 申請(專利權(quán))人: | 中國人民解放軍軍事科學院軍事醫(yī)學研究院;北京蛋白質(zhì)組研究中心;中國科學院數(shù)學與系統(tǒng)科學研究院 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100850*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 概率 輔助 肽段可 檢測 預測 方法 | ||
1.一種酶切概率輔助的肽段可檢測性預測方法,其步驟包括:
1)從已鑒定蛋白中篩選出高可信蛋白;
2)構(gòu)建酶切位點酶切概率預測模型訓練集,訓練酶切位點酶切概率預測模型;
3)對所有高可信蛋白進行理論酶切,得到理論酶切肽段;
4)利用所述酶切位點酶切概率預測模型預測的酶切位點的酶切概率,再根據(jù)酶切位點的酶切概率計算獲得所有理論酶切肽段的酶切概率;
5)構(gòu)建肽段可檢測性訓練集,訓練肽段可檢測性模型;
6)利用所述肽段可檢測性模型預測設(shè)定蛋白的所有理論酶切肽段的肽段可檢測性。
2.如權(quán)利要求1所述的方法,其特征在于,所述高可信蛋白為已鑒定蛋白中蛋白的譜圖數(shù)目大于設(shè)定閾值h1、且蛋白的序列覆蓋度大于設(shè)定閾值h2的蛋白;或所述高可信蛋白為已鑒定蛋白中蛋白的譜圖數(shù)目和蛋白的序列覆蓋度降序排序均靠前的蛋白。
3.如權(quán)利要求1所述的方法,其特征在于,構(gòu)建所述酶切位點酶切概率預測模型訓練集的步驟包括:
3-1)將鑒定肽段集合中與所述高可信蛋白關(guān)聯(lián)的鑒定肽段回溯到所述高可信蛋白的蛋白序列中,然后根據(jù)鑒定肽段的回溯位置收集所述蛋白序列中的酶切位點信息;并根據(jù)所述酶切位點信息將酶切位點劃分為陽性位點和陰性位點;
3-2)取酶切位點左右T位相鄰氨基酸組成長度為2T+1的2T+1連子;如果酶切位點出現(xiàn)在蛋白序列的N端或者C端,導致酶切位點的左端或者右端沒有足夠的氨基酸組成2T+1連子,則以占位符“Z”進行填充;
3-3)對每個所述連子,將除中間位置的氨基酸之外的每個氨基酸轉(zhuǎn)換成21維的0-1向量,從而將每個所述連子轉(zhuǎn)換成一個42T維的0-1向量;將所述陽性位點的標簽設(shè)置為1,將所述陰性位點的標簽設(shè)置為0。
4.如權(quán)利要求3所述的方法,其特征在于,所述酶切位點信息包括:酶切位點左邊肽段的譜圖數(shù)目之和,記為參數(shù)L;酶切位點右邊肽段的譜圖數(shù)目之和,記為參數(shù)R;以酶切位點作為漏切位點的肽段的譜圖數(shù)目之和,記為參數(shù)O;將符合條件1)~3)的酶切位點歸為陽性位點:1)L大于等于1,2)R大于等于1,3)O等于0;將符合條件a)~c)的酶切位點歸為陰性位點:a)L等于0,b)R等于0,c)O大于等于2。
5.如權(quán)利要求3所述的方法,其特征在于,預測所有理論酶切肽段的酶切概率的步驟包括:
5-1)獲取所有理論酶切肽段的左端酶切位點、右端酶切位點和漏切酶切位點對應的所述2T+1連子,并將其轉(zhuǎn)換成42T維的0-1向量;
5-2)使用所述酶切概率預測模型預測步驟5-1)中各酶切位點的酶切概率;
5-3)根據(jù)步驟5-2)中預測的酶切位點的酶切概率,按照公式計算所有理論酶切肽段的酶切概率;其中,epep表示肽段的酶切概率,el表示肽段左端酶切位點的酶切概率,er表示肽段右端酶切位點的酶切概率,ei表示肽段中漏切酶切位點的酶切概率,n表示肽段中的漏切酶切位點數(shù)目。
6.如權(quán)利要求1所述的方法,其特征在于,對所有高可信蛋白進行理論酶切是指將所述高可信蛋白的序列模擬酶切為理論酶切肽段;其中,將允許的肽段最長或者最短長度分別設(shè)置為所有鑒定肽段的最長或者最短長度,將肽段中允許的最多漏切位點數(shù)目設(shè)置為2。
7.如權(quán)利要求1所述的方法,其特征在于,構(gòu)建肽段可檢測性訓練集的步驟包括:對于步驟3)得到的所有理論酶切肽段,將其中被鑒定到且譜圖數(shù)目大于1的肽段歸為陽性肽段,將其中未被鑒定到的肽段歸為陰性肽段;將陽性肽段的標簽設(shè)置為1,陰性肽段的標簽設(shè)置為0;然后分別計算陽性肽段和陰性肽段的屬性特征并將其轉(zhuǎn)換為數(shù)值向量,該屬性特征中包括所述酶切概率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍軍事科學院軍事醫(yī)學研究院;北京蛋白質(zhì)組研究中心;中國科學院數(shù)學與系統(tǒng)科學研究院,未經(jīng)中國人民解放軍軍事科學院軍事醫(yī)學研究院;北京蛋白質(zhì)組研究中心;中國科學院數(shù)學與系統(tǒng)科學研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810901107.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種血管緊張素Ⅱ受體1型免疫原性肽段及其用途
- 一種利用定向肽庫檢測蛋白質(zhì)與其他分子相互作用的方法
- 一種應用于定量蛋白質(zhì)組學研究的穩(wěn)定同位素標記肽段合成及定量新方法
- 一種用于研究蛋白質(zhì)結(jié)構(gòu)或蛋白質(zhì)相互作用的分析方法
- 一種硫巰化翻譯后修飾肽段的定性與定量方法
- 抗氧化肽及其制備方法及包含該抗氧化肽的化妝品
- 一種酶切概率輔助的肽段可檢測性預測方法
- 一種單端交聯(lián)肽去除方法及其在蛋白質(zhì)復合物交聯(lián)位點分析中的應用
- 基于去SUMO化酶和SAX的SUMO化肽段富集方法
- 融合有外源肽段的諾如病毒VP1蛋白、制備方法及應用





