[發明專利]配體特異性蛋白質-配體綁定區域預測方法無效
| 申請號: | 201310450715.2 | 申請日: | 2013-09-27 |
| 公開(公告)號: | CN103500292A | 公開(公告)日: | 2014-01-08 |
| 發明(設計)人: | 於東軍;胡俊;戚湧;唐振民;楊靜宇 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱顯國 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特異性 蛋白質 綁定 區域 預測 方法 | ||
技術領域
本發明涉及蛋白質與配體相互作用預測領域,具體而言涉及一種配體特異性蛋白質-配體綁定區域預測方法。
背景技術
蛋白質在生命活動過程中不是孤立存在的,需要和其他生物分子互相作用來完成特定的功能,這種相互作用在生命過程中普遍存在并且不可或缺。蛋白質通過綁定其他的生物分子來加強或是抑制其生物功能。蛋白質所綁定的生物分子稱為配體,它們可以是金屬離子、小的有機/無機分子、大分子(例如蛋白質)或核酸等等。在和配體相互作用時,蛋白質中一些關鍵的殘基形成一個口袋形狀區域,以完成對特定配體的識別及綁定。這些關鍵殘基稱為綁定殘基,形成的口袋形狀區域又稱為綁定區域。
從一個蛋白質中識別出這些關鍵殘基以及這些殘基所形成的區域,對于理解蛋白質的功能、藥物設計、分析生物分子之間的相互作用,進而指導進一步的生化實驗具有重要意義。雖然說,通過生物學實驗來測定蛋白質-配體綁定區域是最為準確的方法,但由于使用實驗方法所固有的困難性,遠遠不能滿足后基因時代蛋白質測序工作飛速發展的要求,這就對通過使用生物計算技術來對蛋白質-配體綁定區域進行預測提出了極大的需求。
已有預測方法可以大致分為三種類型:基于結構的方法、基于序列的方法以及基于結構和序列的混合方法。
在早期階段,基于結構的方法占據主導地位,比較著名的方法有:LIGSITE,CASTp,SURFNET,POCKET,fpocket,Q-SiteFinder,以及SITEHOUND等等。通常,這些方法基于某種幾何測度,結合蛋白質的3D結構,來定位目標蛋白質的配體綁定區域。
隨后,研究人員發現直接從蛋白質的序列出發也可以有效地進行蛋白質-配體綁定區域的預測。例如,ConSurf和Rate4Site使用多序列聯配技術獲取蛋白質的進化信息,然后基于進化信息特征識別出該蛋白質和配體可能的熱點綁定區域;L1pred綜合八種基于蛋白質序列的得分函數,使用L1-logreg分類器來預測酶蛋白中的接觸反應殘基。
最近,集成蛋白質結構與序列信息的混合方法受到密切關注,期望進一步提高蛋白質-配體的預測性能。例如,通過引入蛋白質表面殘基的進化信息保留度,基于結構的LIGSITE被進一步擴展為LIGSITEcsc;ConCavity集成了蛋白質序列的進化保留信息和基于結構的方法來預測蛋白質表面的pocket;SURFNET-ConSurf同樣也是在基于結構的方法中加入了蛋白質殘基的進化信息來進一步提高預測性能。
然而,綜合分析以上預測模型,可以發現:一方面,現有的方法通常是在一般意義上來進行預測,而沒有充分考慮配體類型之間的差異性,從而降低了預測結果的可靠性;另一方面,現有方法中的絕大多數只是一種綁定狀態預測,他們將序列中的每個殘基判定為綁定或是非綁定兩種狀態之一,只是綁定殘基預測,而不是真正意義上的綁定區域預測。我們相信,如果能從預測出的綁定殘基出發,進一步判定哪些殘基會構成綁定區域,對于理解蛋白質-配體的相互作用意義將更為明顯。
發明內容
本發明旨在提供一種配體特異性蛋白質-配體綁定區域預測方法,可克服上述現有技術中傳統的蛋白質-配體預測方法存在的兩個基本問題,預測速度快、預測精度高。
為達成上述目的,本發明所采用的技術方案如下:
一種配體特異性蛋白質-配體綁定區域預測方法,包括以下步驟:
步驟1:基于輸入的蛋白質序列信息,使用配體特異性預測模型,預測出蛋白質序列中的蛋白質-配體綁定殘基,過程如下:
步驟1.1:多視角特征的抽取與組合
使用PSI-BLAST算法抽取蛋白質序列的進化信息,使用PSIPRED算法抽取蛋白質序列的二級結構信息,以及統計20種基本氨基酸在不同配體上的綁定傾向性;再利用滑動窗口方式,將蛋白質序列中的每個殘基進行多視角特征表示;
步驟1.2:綁定殘基預測
使用事先訓練好的配體特異性預測模型對蛋白質序列中的每個殘基配體的概率進行預測,概率高于指定閾值的殘基被預測為綁定殘基,其中:配體特異性預測模型使用標準的支持向量機模型;
步驟2:將步驟1所得到綁定殘基進行空間聚類,使用空間聚類算法,進行空間聚類,進而得到一個或是多個綁定區域。
進一步的實施例中,如果輸入的蛋白質序列信息為PDB文件格式的3D結構,則在所述步驟1進行配體特異性特征抽取時,需要先從3D結構中提取出蛋白質序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310450715.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:后擋風玻璃平臺融入式冰箱
- 下一篇:一種熱泵系統
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





