[發明專利]配體特異性蛋白質-配體綁定區域預測方法無效
| 申請號: | 201310450715.2 | 申請日: | 2013-09-27 |
| 公開(公告)號: | CN103500292A | 公開(公告)日: | 2014-01-08 |
| 發明(設計)人: | 於東軍;胡俊;戚湧;唐振民;楊靜宇 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 南京理工大學專利中心 32203 | 代理人: | 朱顯國 |
| 地址: | 210094 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特異性 蛋白質 綁定 區域 預測 方法 | ||
1.一種配體特異性蛋白質-配體綁定區域預測方法,其特征在于,包括以下步驟:
步驟1:基于輸入的蛋白質序列信息,使用配體特異性預測模型,預測出蛋白質序列中的蛋白質-配體綁定殘基,過程如下:
步驟1.1:多視角特征的抽取與組合
使用PSI-BLAST算法抽取蛋白質序列的進化信息,使用PSIPRED算法抽取蛋白質序列的二級結構信息,以及統計20種基本氨基酸在不同配體上的綁定傾向性;再利用滑動窗口方式,將蛋白質序列中的每個殘基進行多視角特征表示;
步驟1.2:綁定殘基預測
使用事先訓練好的配體特異性預測模型對蛋白質序列中的每個殘基配體的概率進行預測,概率高于指定閾值的殘基被預測為綁定殘基,其中:配體特異性預測模型使用標準的支持向量機模型;
步驟2:將步驟1所得到綁定殘基進行空間聚類,使用空間聚類算法,進行空間聚類,進而得到一個或是多個綁定區域。
2.根據權利要求1所述的配體特異性蛋白質-配體綁定區域預測方法,其特征在于,如果基于輸入的蛋白質序列信息為PDB文件格式的3D結構,則在所述步驟1進行配體特異性特征抽取時,需要先從3D結構中提取出蛋白質序列。
3.根據權利要求1所述的配體特異性蛋白質-配體綁定區域預測方法,其特征在于,在所述步驟2進行空間聚類時,如果用戶輸入的蛋白質序列信息是蛋白質序列而不是PDB文件格式的3D結構,則需要將其進行3D建模得到3D結構后方可進行空間聚類。
4.根據權利要求3所述的配體特異性蛋白質-配體綁定區域預測方法,其特征在于,對用戶輸入的蛋白質序列信息進行建模以獲得3D結構的方法包括MODELLER算法或者I-TASSER算法。
5.根據權利要求1所述的配體特異性蛋白質-配體綁定區域預測方法,其特征在于,在所述步驟1.2中,所述指定閾值取值范圍為0~1,該指定閾值滿足以下條件:使得預測結果的馬氏相關系數最大化。
6.根據權利要求1所述的配體特異性蛋白質-配體綁定區域預測方法,其特征在于,在所述步驟1.1中,按照下述步驟進行多視角特征的抽取與組合:
①使用PSI-BLAST算法抽取蛋白質序列的進化信息,進化信息特征是一個n×20的位置特異性得分矩陣:
其中,參數I、V、…、R表示的20種基本氨基酸;pi,j表示的位置特異性得分;
②使用PSIPRED算法抽取預測出蛋白質序列的二級結構信息,即二級結構概率矩陣:
其中,C、H、E表示蛋白質的三種二級結構類型,分別對應Coil,Helix,Strand;si,j表示蛋白質序列中第i個殘基是第j種二級結構類型的概率;
③針對每個不同的配體類型,統計出20種基本氨基酸的配體特異性綁定傾向性;
④從位置特異性得分矩陣、二級結構概率矩陣、蛋白質殘基綁定傾向性這三個視角,使用滑動窗口方式來提取每個殘基的特征向量。
7.根據權利要求1所述的配體特異性蛋白質-配體綁定區域預測方法,其特征在于,在所述步驟2中,空間聚類算法對空間上緊鄰的綁定殘基簇進行聚類,對于兩個綁定殘基之間的空間距離大于指定分割閾值的,進行空間聚類,進而預測出的綁定殘基聚類為一個或是多個綁定區域。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310450715.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:后擋風玻璃平臺融入式冰箱
- 下一篇:一種熱泵系統
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





