[發(fā)明專利]基于Pathway蛋白質(zhì)組學(xué)的質(zhì)譜優(yōu)選肽段自動(dòng)挑選方法無效
| 申請(qǐng)?zhí)枺?/td> | 201110452448.3 | 申請(qǐng)日: | 2011-12-29 |
| 公開(公告)號(hào): | CN102567653A | 公開(公告)日: | 2012-07-11 |
| 發(fā)明(設(shè)計(jì))人: | 唐曉英;劉雪琴 | 申請(qǐng)(專利權(quán))人: | 北京理工大學(xué) |
| 主分類號(hào): | G06F19/18 | 分類號(hào): | G06F19/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100081 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 pathway 蛋白質(zhì) 優(yōu)選 自動(dòng) 挑選 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種質(zhì)譜優(yōu)選肽段的挑選方法,特別涉及一種基于Pathway蛋白質(zhì)組學(xué)的質(zhì)譜優(yōu)選肽段自動(dòng)挑選方法,屬于生物信息學(xué)技術(shù)領(lǐng)域。
背景技術(shù)
在蛋白質(zhì)組研究領(lǐng)域中,質(zhì)譜儀器對(duì)目標(biāo)肽段的準(zhǔn)確挑選與否對(duì)實(shí)驗(yàn)結(jié)果有著極其重要的影響。為了使質(zhì)譜儀器對(duì)目標(biāo)肽段的挑選更加準(zhǔn)確,常規(guī)的做法是將質(zhì)譜分析總時(shí)間分為數(shù)個(gè)segment,在每個(gè)segment里設(shè)定給予優(yōu)先選擇的肽段,這樣可以防止目標(biāo)肽段被其他高豐度雜質(zhì)肽段或噪聲所掩蓋。
但是現(xiàn)在設(shè)定優(yōu)選肽段都是由人工來實(shí)現(xiàn)的,實(shí)驗(yàn)人員在實(shí)驗(yàn)設(shè)計(jì)時(shí)做出實(shí)驗(yàn)假說,并據(jù)此確定實(shí)驗(yàn)過程中需要重點(diǎn)關(guān)注的蛋白。例如,實(shí)驗(yàn)人員在實(shí)驗(yàn)設(shè)計(jì)時(shí)假設(shè)糖尿病患者血清樣本中的glucose含量會(huì)發(fā)生變化,則會(huì)在實(shí)驗(yàn)中驗(yàn)證glucose的含量變化是否符合假設(shè),在每個(gè)segment中將優(yōu)選肽段確定為glucose的肽段。因此,每個(gè)segment中優(yōu)選肽段的確定極度依賴實(shí)驗(yàn)人員的經(jīng)驗(yàn),易遺漏該疾病導(dǎo)致的其他未知蛋白質(zhì)的含量變化;而且手動(dòng)挑選的過程工作量繁冗,面對(duì)海量生物數(shù)據(jù)易使人產(chǎn)生疲勞感,從而導(dǎo)致實(shí)驗(yàn)結(jié)果的不理想與實(shí)驗(yàn)的投入產(chǎn)出比不高。
發(fā)明內(nèi)容
本發(fā)明的目的是針對(duì)現(xiàn)有技術(shù)的缺點(diǎn),利用計(jì)算機(jī)實(shí)現(xiàn)質(zhì)譜優(yōu)選肽段的自動(dòng)篩選,取代生物實(shí)驗(yàn)者手動(dòng)挑選工作量的繁冗,大大提高蛋白質(zhì)組實(shí)驗(yàn)的效率,并擴(kuò)大蛋白的關(guān)注范圍,提高發(fā)生含量變化的蛋白的檢出率,為蛋白質(zhì)組的研究提供更便捷的工具。
本發(fā)明提供了一種基于Pathway蛋白質(zhì)組學(xué)的質(zhì)譜優(yōu)選肽段自動(dòng)挑選方法,包括以下步驟:
A.將目標(biāo)代謝通路上所有涉及到的蛋白質(zhì)名稱作為關(guān)鍵詞,對(duì)待研究生物的全蛋白序列進(jìn)行目標(biāo)蛋白群的提取;
B.對(duì)所提取的目標(biāo)蛋白群按照實(shí)驗(yàn)所用的蛋白酶進(jìn)行理論酶切,產(chǎn)生所有目標(biāo)蛋白的理論酶切肽段;
C.計(jì)算所有的理論酶切肽段的理論分子量(Mass)、理論保留時(shí)間(NET)、等電點(diǎn)(pI);
D.根據(jù)實(shí)際設(shè)定的理論分子量和等電點(diǎn)篩選符合條件的理論肽段,得到質(zhì)譜的優(yōu)選肽段集合,即所有實(shí)驗(yàn)中需要重點(diǎn)關(guān)注的肽段;該肽段集合及每個(gè)肽段的理論保留時(shí)間作為在實(shí)際實(shí)驗(yàn)的每個(gè)segment中設(shè)定優(yōu)選肽段的依據(jù)。
有益效果
本發(fā)明提供的方法便于計(jì)算機(jī)實(shí)現(xiàn),可以取代傳統(tǒng)的人工手動(dòng)挑選方式,避免生物實(shí)驗(yàn)者手動(dòng)挑選工作量的繁冗,大大提高蛋白質(zhì)組實(shí)驗(yàn)的效率,并擴(kuò)大蛋白的關(guān)注范圍,提高發(fā)生含量變化的蛋白的檢出率,使蛋白質(zhì)組的研究更加便捷與準(zhǔn)確。
附圖說明
圖1為本發(fā)明提供的基于蛋白質(zhì)組學(xué)的質(zhì)譜優(yōu)選肽段自動(dòng)挑選方法的流程圖。
具體實(shí)施方式
為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清晰明了,以下結(jié)合附圖,具體說明本發(fā)明的優(yōu)選實(shí)施方式。
圖1為本實(shí)施方式實(shí)現(xiàn)的基于Pathway驅(qū)動(dòng)定量蛋白質(zhì)組學(xué)的質(zhì)譜優(yōu)選肽段計(jì)算機(jī)自動(dòng)挑選方法的流程圖,該方法包括以下步驟:
步驟101:以fasta文件格式讀取待研究生物的全蛋白序列。本例選用大腸桿菌,從NCBI獲取其全蛋白序列,記為ecoli.fasta,該文件中每個(gè)蛋白質(zhì)以“>”作為每一個(gè)蛋白的開始;
步驟102:根據(jù)待研究的目標(biāo)代謝途徑,以txt文件格式讀取目標(biāo)代謝途徑上涉及的蛋白質(zhì)名稱,本例以大腸桿菌糖代謝途徑為研究對(duì)象,將該代謝途徑上的蛋白名稱儲(chǔ)存于targetprotein.txt文件中,每個(gè)蛋白名稱單獨(dú)占據(jù)一行,共17個(gè)蛋白;
步驟103:根據(jù)步驟102讀取的目標(biāo)代謝途徑蛋白質(zhì),從步驟101讀取的全蛋白序列中提取出對(duì)應(yīng)蛋白質(zhì)序列,提取出的信息包括該蛋白的名稱、種屬來源、氨基酸序列,目標(biāo)蛋白序列存于targetsequence.txt文件中;
目標(biāo)蛋白群的提取可以采用字符串匹配方法簡(jiǎn)單實(shí)現(xiàn):讀取targetprotein.txt里的每行,采用迭代的方法在ecoli.fasta文件里尋找相同字符串,將含有相同字符串的蛋白質(zhì)從全蛋白文件中提取出來。
步驟104:對(duì)步驟103提取出的蛋白質(zhì)序列進(jìn)行理論酶切,按照所用的蛋白酶對(duì)蛋白質(zhì)氨基酸序列的特異性酶切位點(diǎn),將目標(biāo)蛋白群各自的氨基酸序列在特異性位點(diǎn)進(jìn)行酶切,產(chǎn)生理論酶切肽段總庫,存于peptides.txt。本實(shí)施例中所用的蛋白酶為胰蛋白酶,賴氨酸(K)和精氨酸(R)為其特異性酶切位點(diǎn)。本實(shí)施例中,理論酶切采用的方法是:對(duì)氨基酸序列逐位讀取識(shí)別,遇“K”或“R”即進(jìn)行切割。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京理工大學(xué),未經(jīng)北京理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110452448.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 替代途徑的血清滅菌蛋白調(diào)節(jié)及其應(yīng)用
- 全細(xì)胞蛋白和基因相互作用網(wǎng)絡(luò)分析系統(tǒng)
- 一種分析miRNA與mRNA相互關(guān)系的方法
- 一種查找特定代謝通路miRNA靶基因的方法
- 一種RT-PCR檢測(cè)基因的分析方法
- 用于抑制血管新生的融合蛋白
- 影響尿路結(jié)石形成的標(biāo)靶基因和關(guān)鍵信號(hào)通路及其用途
- 盒子遙控器(Pathway-RCU)
- 單組學(xué)及多組學(xué)KEGG PATHWAY map表達(dá)熱圖個(gè)性化展示的方法及應(yīng)用
- 基于雙流法的胃鏡視頻部位識(shí)別網(wǎng)絡(luò)結(jié)構(gòu)





