[發明專利]基于有監督上采樣學習的蛋白質?核苷酸綁定位點預測方法有效
| 申請號: | 201410223569.4 | 申請日: | 2014-05-25 |
| 公開(公告)號: | CN104077499B | 公開(公告)日: | 2018-01-05 |
| 發明(設計)人: | 於東軍;胡俊;何雪;李陽;沈紅斌;楊靜宇 | 申請(專利權)人: | 南京理工大學 |
| 主分類號: | G06F19/16 | 分類號: | G06F19/16 |
| 代理公司: | 南京理工大學專利中心32203 | 代理人: | 朱顯國 |
| 地址: | 210000 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 監督 采樣 學習 蛋白質 核苷酸 定位 預測 方法 | ||
技術領域
本發明涉及生物信息學蛋白質-核苷酸相互作用領域,具體而言涉及一種基于有監督上采樣學習方法的蛋白質-核苷酸綁定位點預測方法。
背景技術
核苷酸包括腺苷三磷酸(ATP)、腺苷二磷酸(ADP)、腺嘌呤核苷酸(AMP)等,是一類重要的生物大分子,對于生物中的膜傳輸、肌肉收縮、細胞運輸、信號傳遞、DNA復制與轉錄以及其他生命活動具有重要意義。在實現上述核苷酸的功能過程中,蛋白質與核苷酸之間的相互作用起到了至關重要的作用;這種相互作用是生命活動中普遍存在且不可或缺的。
通過生物實驗的方法來確定蛋白質與核苷酸之間的綁定位點需要耗費大量的時間和資金,并且效率較低。隨著測序技術的飛速發展和人類結構基因組的推進,蛋白質組學中已經累積了大量未進行與核苷酸綁定位點標定的蛋白質序列。因此應用生物信息學的相關知識,研發能夠直接從蛋白質序列出發進行蛋白質-核苷酸綁定位點快速且準確的智能預測方法有著迫切需求,且對于發現和認識蛋白質結構和生理功能有著重要的意義。
目前,針對基于序列的蛋白質-核苷酸綁定位點預測模型還很欠缺且預測精度不足。查閱文獻可以發現,用來專門預測蛋白質與腺苷三磷酸(ATP)綁定位點的預測模型有:ATPint(J.S.Chauhan,N.K.Mishra,and G.P.Raghava,"Identification of ATP binding residues of a protein from its primary sequence,"BMC Bioinformatics,vol.10,pp.434,2009)、ATPsite(K.Chen,M.J.Mizianty,and L.Kurgan,"ATPsite:sequence-based prediction of ATP-binding residues,"Proteome Sci,vol.9 Suppl 1,pp.S4,2011.)、targetATP(Yu D J,Hu J,Tang Z M,et al.Improving protein-ATP binding residues prediction by boosting SVMs with random under-sampling[J].Neurocomputing,2013,104:180-190.)和TargetATPsite(Yu D J,Hu J,Huang Y,et al.TargetATPsite:A template‐free method for ATP‐binding sites prediction with residue evolution image sparse representation and classifier ensemble[J].Journal of computational chemistry,2013,34(11):974-985.)等;這些蛋白質與腺苷三磷酸(ATP)綁定位點預測模型都使用了氨基酸殘基的位置特異性得分矩陣與支持向量機算法,并且都取得了精度上的提高,然而它們都只研究了蛋白質與腺苷三磷酸(ATP)的綁定位點預測問題,而忽略了蛋白質與其他種類的核苷酸綁定位點預測問題。因此為了彌補上述不足,Kurgan et al.(Chen K,Mizianty M J,Kurgan L.Prediction and analysis of nucleotide-binding residues using sequence and sequence-derived structural descriptors[J].Bioinformatics,2012,28(3):331-341.)在2012年研發了一個可以分別預測蛋白質與多種類別核苷酸綁定位點的模型NsitePred;Yu et al.(Yu D,Hu J,Yang J,et al.Designing template-free predictor for targeting protein-ligand binding sites with classifier ensemble and spatial clustering[J].2013.)在2013年基于一個規模更大的數據集研發了一個精度更高的預測模型TargetS,TargetS預測模型不僅可以預測蛋白質與核苷酸綁定位點,還可以預測蛋白質與金屬原子的綁定位點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京理工大學,未經南京理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410223569.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





