[發(fā)明專利]譜庫的生成方法和串聯(lián)質(zhì)譜譜圖鑒定方法有效
| 申請?zhí)枺?/td> | 201010208640.3 | 申請日: | 2010-06-13 |
| 公開(公告)號: | CN101871945A | 公開(公告)日: | 2010-10-27 |
| 發(fā)明(設(shè)計)人: | 葉叮;付巖;孫瑞祥;賀思敏 | 申請(專利權(quán))人: | 中國科學(xué)院計算技術(shù)研究所 |
| 主分類號: | G01N33/68 | 分類號: | G01N33/68;G01N27/62 |
| 代理公司: | 北京泛華偉業(yè)知識產(chǎn)權(quán)代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 生成 方法 串聯(lián) 質(zhì)譜譜 圖鑒 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及蛋白質(zhì)組鑒定方法,特別涉及一種譜庫的生成方法和串聯(lián)質(zhì)譜譜圖鑒定方法。
背景技術(shù)
眾所周知,絕大多數(shù)生物的遺傳信息保存在DNA中。DNA通過轉(zhuǎn)錄過程生成信使RNA,而信使RNA又通過翻譯過程生成蛋白質(zhì),從而實現(xiàn)了遺傳信息由DNA到RNA再到蛋白質(zhì)的傳遞,這一過程也被稱為生命的中心法則。在從RNA翻譯生成蛋白質(zhì)的過程中,20種氨基酸以肽鍵順序相連所形成的鏈狀分子被稱為肽,而其中分子量達到一定級別的肽則被稱為蛋白質(zhì)。大多數(shù)蛋白質(zhì)在翻譯形成后,會在蛋白質(zhì)中的某些氨基酸上增加某種功能團(如在蛋白質(zhì)的N末端加入乙酰),或增加了其他的蛋白質(zhì)或肽,或改變了氨基酸的化學(xué)性質(zhì)或結(jié)構(gòu),這一過程被稱為發(fā)生了化學(xué)修飾,由于該過程發(fā)生在前述的翻譯過程后,因此在蛋白質(zhì)氨基酸上所發(fā)生的變化也被稱為蛋白質(zhì)翻譯后修飾。蛋白質(zhì)翻譯后修飾能夠改變氨基酸的化學(xué)性質(zhì),引起蛋白質(zhì)結(jié)構(gòu)的改變,擴充蛋白質(zhì)的功能。很多蛋白質(zhì)的重要生物活性都是在發(fā)生翻譯后修飾之后才具有的。此外,在體外的蛋白質(zhì)樣品處理中,也經(jīng)常會有意或無意的人為引入一些化學(xué)修飾。修飾質(zhì)量的絕對值通常都比較大,如大于10Da。
目前已知的蛋白質(zhì)修飾類型已有幾百種,檢測蛋白質(zhì)樣品中發(fā)生了哪些翻譯后修飾對于蛋白質(zhì)鑒定是個重要而困難的問題。液相色譜與質(zhì)譜儀聯(lián)用,并結(jié)合數(shù)據(jù)庫搜索計算是目前蛋白質(zhì)組學(xué)中鑒定蛋白質(zhì)及其翻譯后修飾的常用方法。在這種方法中,通過液相色譜與質(zhì)譜儀聯(lián)用可以得到蛋白質(zhì)樣品的實驗串聯(lián)質(zhì)譜。實驗串聯(lián)質(zhì)譜的獲取過程包括:蛋白質(zhì)樣品首先被選定的蛋白酶水解,形成肽混合物;肽混合物通過液相色譜進行分離,不同物理化學(xué)性質(zhì)的肽先后從色譜柱中流出;從色譜柱中流出的肽不斷進入質(zhì)譜儀;肽在質(zhì)譜儀中被離子化,肽段離子也被稱為母離子,具有特定質(zhì)量電荷比的肽離子在能量作用下碎裂形成碎片離子,碎片離子被分離和檢測形成肽碎片離子譜;通過以上過程便得到蛋白質(zhì)的實驗串聯(lián)質(zhì)譜。在得到實驗串聯(lián)質(zhì)譜后就可以從實驗串聯(lián)質(zhì)譜中鑒定肽的氨基酸序列,進而鑒定蛋白質(zhì)。從實驗串聯(lián)質(zhì)譜中鑒定肽的氨基酸序列時通常采用數(shù)據(jù)庫搜索計算的方法。
數(shù)據(jù)庫搜索計算的方法有多種,譜庫搜索方法是其中的典型代表。所述譜庫的全稱為譜圖數(shù)據(jù)庫,它是由實驗譜圖數(shù)據(jù)組織而成的集合。譜庫搜索方法的基本實現(xiàn)步驟包括:在計算過程中,將待檢測蛋白質(zhì)的實驗串聯(lián)質(zhì)譜與譜庫中所保存的實驗串聯(lián)質(zhì)譜進行比較,從所述譜庫中選擇母離子質(zhì)量(或質(zhì)荷比)相同或相近的實驗串聯(lián)質(zhì)譜作為候選結(jié)果,最后再通過諸如打分機制等方式從所述候選結(jié)果中找出與待檢測蛋白質(zhì)的實驗串聯(lián)質(zhì)譜相匹配的實驗串聯(lián)質(zhì)譜圖。通常,譜庫中的實驗串聯(lián)質(zhì)譜圖所對應(yīng)的各種信息是已知的,因此,也就可以由此鑒定出肽的氨基酸序列,進而鑒定蛋白質(zhì)。
從上述說明可以看出,所述譜庫中的實驗串聯(lián)質(zhì)譜的母離子質(zhì)量(或質(zhì)荷比)只有與待檢測蛋白質(zhì)的實驗串聯(lián)質(zhì)譜的質(zhì)荷比相同或相近才有可能成為所述的候選結(jié)果,這種對候選結(jié)果的質(zhì)荷比范圍有嚴(yán)格規(guī)定的譜庫搜索方法又被稱為限制性搜索方法。在現(xiàn)有的譜庫搜索方法及實際運用中,限制性搜索方法占了絕大多數(shù)。但正如前文所提到的那樣,蛋白質(zhì)翻譯后修飾是本領(lǐng)域中的一種常見現(xiàn)象,如果待檢測蛋白質(zhì)中的某個肽段發(fā)生了某種翻譯后修飾,而之前生成的譜庫中由于譜圖覆蓋率的限制,只引入了該肽段的無修飾形式或含有其它種類修飾形式的譜圖,那么在利用前述的譜庫搜索方法時,正確的候選肽的實驗串聯(lián)質(zhì)譜可能根本就不會進入候選結(jié)果中,這必然會影響蛋白質(zhì)鑒定的準(zhǔn)確性。在目前的蛋白質(zhì)組實驗中,質(zhì)譜儀產(chǎn)生的大部分譜圖不能有效解析,譜圖解析率只有10%到30%,一個重要原因就是蛋白質(zhì)中具有未知或未預(yù)料到的修飾,從而無法找到正確的候選肽,影響了后續(xù)的鑒定過程。
發(fā)明內(nèi)容
本發(fā)明的目的是克服現(xiàn)有的基于譜庫的鑒定方法由于蛋白質(zhì)中所具有的未知或未預(yù)料到的修飾而無法找到正確的候選譜圖,影響鑒定準(zhǔn)確性的缺陷,從而提供一種高準(zhǔn)確性的譜圖鑒定方法。
本發(fā)明提供了一種譜圖數(shù)據(jù)庫的生成方法,包括:
步驟1)、選取已解析的實驗串聯(lián)質(zhì)譜譜圖,所述已解析的串聯(lián)質(zhì)譜譜圖中包括母離子肽序列、電荷、修飾類型和位點在內(nèi)的信息;
步驟2)、從所述已解析的實驗串聯(lián)質(zhì)譜譜圖中去除冗余譜圖,得到代表譜;
步驟3)、將所述代表譜所代表的母離子肽序列按理論碎裂模式進行劃分,得到與所述代表譜相對應(yīng)的理論譜;
步驟4)、合并所述代表譜與所對應(yīng)的理論譜,得到優(yōu)化譜;
步驟5)、對所述優(yōu)化譜做譜峰標(biāo)注,由譜峰標(biāo)注后的優(yōu)化譜生成譜圖數(shù)據(jù)庫。
上述技術(shù)方案中,還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院計算技術(shù)研究所,未經(jīng)中國科學(xué)院計算技術(shù)研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010208640.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種可保護血管壁的內(nèi)瘺針
- 下一篇:播放實景電影的多屏幕裝置
- 四極質(zhì)譜計相對靈敏度校準(zhǔn)系統(tǒng)
- 四極質(zhì)譜計相對靈敏度校準(zhǔn)系統(tǒng)
- 譜庫的生成方法和串聯(lián)質(zhì)譜譜圖鑒定方法
- 一種氦質(zhì)譜檢漏儀質(zhì)譜室腔體
- 多級質(zhì)譜生物大分子結(jié)構(gòu)鑒定方法
- 樣品質(zhì)譜分析
- 黃曲霉毒素生物合成通路靶向代謝組分析方法
- 質(zhì)譜數(shù)據(jù)處理方法和裝置、計算機設(shè)備、計算機存儲介質(zhì)
- 一種基于深度學(xué)習(xí)的質(zhì)譜檢測方法
- 一種臨床蛋白質(zhì)質(zhì)譜數(shù)據(jù)的分類系統(tǒng)及方法





