[發明專利]一種檢測差異表達蛋白質的方法有效
| 申請號: | 201310397694.2 | 申請日: | 2013-09-04 |
| 公開(公告)號: | CN103776891A | 公開(公告)日: | 2014-05-07 |
| 發明(設計)人: | 劉超;宋春青;遲浩;孫瑞祥;董夢秋;賀思敏 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G01N27/62 | 分類號: | G01N27/62 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 檢測 差異 表達 蛋白質 方法 | ||
技術領域
本發明涉及定量蛋白質組學領域,特別涉及一種檢測差異表達蛋白質的方法。
背景技術
定量蛋白質組學主要通過生物質譜技術研究復雜生物樣品中蛋白質的表達情況,其中一項重要的研究目標是在不同生物樣品中檢測差異表達蛋白質。
對于某些重要的蛋白質,如與癌癥相關的核心巖藻糖蛋白質,在癌癥患者體內的表達量要遠遠高于正常人。該差異表達的核心巖藻糖蛋白質可以作為肝癌早期診斷標志物。在其他諸如生物信號傳導、細胞衰老以及翻譯后修飾等生命過程中,差異表達蛋白質都起到了主導作用。據報道,2011年,美國藥品研究與制造商協會(PhRMA)的成員公司總共投入495億美元研究經費,其中絕大部分經費用于尋找疾病標志物,即檢測和確認患者體內與正常人體內差異表達的蛋白質。這些差異表達蛋白質與疾病有直接關系,可以測量相關人群這些蛋白質的表達量,用于診斷是否患病。
傳統的生物化學方法,如蛋白質印跡法,一次實驗需要耗費數天的時間,卻只能檢測一個或數個高豐度蛋白質在兩個樣品中表達量的差異。生物體內含有數以千計的蛋白質,使用這類方法一一進行檢測需要消耗大量的人力和物力。而生物質譜技術具有靈敏度好、動態線性范圍大、通量高等優點,可以一次性分析數千蛋白質。德國和瑞士的科學家報道說使用生物質譜技術數個小時內即可檢測到大腸桿菌體內的5000個蛋白質,占大腸桿菌全部蛋白質的90%以上;可以檢測到人體內1萬個以上蛋白質,并且數目還在增加。
生物質譜技術的核心功能是將蛋白質在生物體中的表達量的信息“數字化”,即對某復雜生物樣品采集質譜數據,而后使用計算技術分析這些數據,還原蛋白質的表達量信息。2009年,當今國際上蛋白質組學3大主要引領者之一,瑞士聯邦理工學院分子系統生物學研究所的Ruedi?Aebersold教授在期刊《Nature?Methods》上發表了一篇文章,認為使用計算技術分析質譜數據是整個定量蛋白質組學中最關鍵、最有挑戰性的研究問題。這里面的難點包括:(1)一次質譜實驗采集的數據可以達到近百GB的規模,需要有方法快速地自動化分析;(2)不同蛋白質在質譜儀中的信號可能會相互重疊、相互干擾,需要專門的算法去干擾,盡可能精準地提取蛋白質信號;(3)需要從統計學意義上確定哪些蛋白質是差異表達的,并對結果的準確性進行評價。
目前已有的面向蛋白質質譜數據的分析方法,最主要的問題是對信號重疊、信號干擾的處理能力較弱,得出的定性、定量結果中有相當比例都是不準確的,并且幾乎沒有算法對蛋白質的定量結果的準確性進行評價。這導致使用該方法檢測的差異表達蛋白質無法完全信任,需要后續使用多種傳統的生物化學手段再進行一一驗證,還要耗費了大量的人力和物力,且增長了研究周期。該問題一直是限制標志物檢測研究取得突破性進展的瓶頸。
目前蛋白質定量的主流技術是,面向定量蛋白質組學中的基于一級譜圖信息的標記和非標記的相對定量數據分析,廣泛應用于生物標志物發現、臨床診斷、生物信號傳導過程以及翻譯后修飾研究等領域。
發明內容
為了解決上述問題,本發明的目的在于提出一種檢測差異表達蛋白質的方法,面向定量蛋白質組學中的基于一級譜圖信息的標記和非標記的相對定量數據分析,根據某一蛋白質在兩種或多種生物樣品中對應的質譜信號強度比值判斷其是否是差異表達蛋白質。
本發明公開了一種檢測差異表達蛋白質的方法,包括:
步驟1,對質譜數據進行預處理,用于將該蛋白質的原始二進制質譜數據轉換為文本格式,并建立索引;
步驟2,對二級譜圖進行肽譜匹配,確定樣品中含有的肽段,用于對二級譜圖與蛋白質數據庫中的記錄的肽段進行匹配打分,取高可信的匹配結果;或者直接從二級譜圖推測肽段序列,取高可信的結果;
步驟3,提取每個肽段在兩種生物樣品和多種生物樣品中的信號,以多個同位素曲線的形式進行表示;
步驟4,將相同肽段在不同樣品中的信號之間建立對應關系,計算其表達量差異的肽段比值和置信區間;
步驟5,將肽段比值歸并為蛋白質比值,并給出蛋白質比值的置信區間;
步驟6,確定差異表達的蛋白質。
所述的檢測差異表達蛋白質的方法,肽段信號以多個同位素色譜曲線的形式進行表示。
所述的檢測差異表達蛋白質的方法,基于干擾最小的同位素色譜曲線計算肽段比值,具體方法為局部最小一乘法,并計算比值的置信區間。
所述的檢測差異表達蛋白質的方法,將肽段比值歸并為蛋白質比值采用核密度估計方法。
所述的檢測差異表達蛋白質的方法,步驟2還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310397694.2/2.html,轉載請聲明來源鉆瓜專利網。





