[發明專利]從頭測序方法及裝置有效
| 申請號: | 201611019740.5 | 申請日: | 2016-11-14 |
| 公開(公告)號: | CN106770605B | 公開(公告)日: | 2019-03-26 |
| 發明(設計)人: | 楊皓;遲浩;周文婧;何昆;曾文鋒;劉超;孫瑞祥;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G01N27/62 | 分類號: | G01N27/62 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司 11280 | 代理人: | 王勇;蘇曉麗 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 候選肽 肽段鑒定 修飾邊 測序 質譜 肽譜 修飾 匹配 肽段序列 大影響 細粒度 準確率 肽段 解析 轉化 統計 發現 | ||
本發明提供了從頭測序方法,其包括將待解析的譜圖轉化為質譜連接圖,統計所述質譜連接圖中各條路徑的得分,提取路徑得分高的前若干條普通路徑和修飾路徑作為候選肽段,其中,所述普通路徑為僅由普通邊組的路徑,所述修改路徑為由普通邊和修飾邊組成的路徑且其中僅包含一條修飾邊;以及對于每個候選肽段進行肽譜匹配打分,取肽譜匹配打分最高的候選肽段作為所述譜圖對應的肽段。該方法可以支持上千種意外修飾的發現,而且不會對肽段鑒定的速度有較大影響。另外,還可以更細粒度地區分相似肽段序列,改善了肽段鑒定的準確率。
技術領域
本發明屬于生物信息學,尤其涉及從頭測序肽段的鑒定。
背景技術
蛋白質組學在最近十多年得到快速的發展,研究人員使用質譜技術用來分析生物樣品時,肽段和蛋白質鑒定方法學已經成為非常關鍵的環節。目前,基于串聯質譜數據的肽段鑒定方法主要分兩類:數據庫搜索方法和從頭測序方法。數據庫搜索方法針對每個譜圖從數據庫中查找所有候選肽段進行匹配打分。但如果正確肽段不在數據庫中,比如新物種或者基因組未測序物種,則通常采用從頭測序方法。從頭測序方法不依賴于數據庫,直接從譜圖中獲取肽段序列。
但是相比數據庫搜索方法,從頭測序方法候選肽段數量大,鑒定速度慢。通常,從頭測序方法的候選肽段數量要比數據庫搜索方法的候選肽段數量大15個量級。而且隨著質譜儀精度越來越高,突變以及意外修飾成為未解析譜圖的關鍵因素。目前大約已有上千種意外修飾。如果從頭測序算法要支持這上千種意外修飾的發現,那么其所要處理的候選肽段數量至少會在現有基礎上再增加兩個數量級,這無疑又會大大地降低肽段鑒定速度。而且在考慮上千種意外修飾后,候選肽段之間的序列相似度非常接近甚至元素組成完全一致,很難區分相似肽段序列。
發明內容
因此,本發明的目的在于克服上述現有技術的缺陷,提供一種新的從頭測序方法。
本發明的目的是通過以下技術方案實現的:
一方面,本發明提供了一種從頭測序方法,包括:
將待解析的譜圖轉化為質譜連接圖,其中所述譜圖中每根譜峰被轉化為所述質譜連接圖的節點,在所述質譜連接圖中如果兩兩節點之間的質量差為氨基酸質量或普通修飾質量,則這兩個節點之間連接有普通邊,該普通邊的打分基于質量大的節點對應的譜峰的強度來確定,如果兩兩節點之間的質量差為意外修飾質量,則這兩個節點之間連接有修飾邊,該修飾邊的打分基于質量大的節點對應的譜峰的強度來確定;
統計所述質譜連接圖中各條路徑的得分,提取路徑得分高的前若干條普通路徑和修飾路徑作為候選肽段,其中,所述普通路徑為僅由普通邊組的路徑,所述修改路徑為由普通邊和修飾邊組成的路徑且其中僅包含一條修飾邊;
對于每個候選肽段進行肽譜匹配打分,取肽譜匹配打分最高的候選肽段作為所述譜圖對應的肽段。
又一方面,本發明提供了一種從頭測序方法,包括:
將待解析的譜圖轉化為質譜連接圖,其中所述譜圖中每根譜峰被轉化為所述質譜連接圖的節點,在所述質譜連接圖中如果兩兩節點之間的質量差為氨基酸質量或普通修飾質量,則這兩個節點之間連接有普通邊,該普通邊的打分基于質量大的節點對應的譜峰的強度來確定,如果兩兩節點之間的質量差為意外修飾質量,則這兩個節點之間連接有修飾邊,該修飾邊的打分基于質量大的節點對應的譜峰的強度來確定;
統計所述質譜連接圖中各條路徑的得分,提取路徑得分高的前若干條普通路徑和修飾路徑作為候選肽段,并記錄各候選肽段的路徑排名,其中,所述普通路徑為僅由普通邊組的路徑,所述修改路徑為由普通邊和修飾邊組成的路徑且其中僅包含一條修飾邊;
對于每個候選肽段進行肽譜匹配打分;
將每個候選肽段的肽譜匹配打分、路徑排名及該候選肽段的修飾豐度作為特征提供給預先訓練好的排序分類器來給該候選肽段進行打分,取得分最高的候選肽段作為所述譜圖對應的肽段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611019740.5/2.html,轉載請聲明來源鉆瓜專利網。





