[發明專利]一種基于結構特征的DNA綁定殘基預測方法在審
| 申請號: | 202110081107.3 | 申請日: | 2021-01-21 |
| 公開(公告)號: | CN112837740A | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 胡俊;白巖松;董世建;鄭琳琳;樊學強;張貴軍 | 申請(專利權)人: | 浙江工業大學 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 杭州斯可睿專利事務所有限公司 33241 | 代理人: | 王利強 |
| 地址: | 310014 浙江省*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 結構 特征 dna 綁定 殘基 預測 方法 | ||
一種基于結構特征的DNA綁定殘基預測方法,首先,根據輸入的待進行DNA綁定殘基預測的蛋白質結構信息,以任一殘基為球心,R為半徑,通過以下四步獲取該殘基的特征向量:1)統計該球內20種常見類型殘基出現的頻率,記作2)統計該球內三類二級結構類別的殘基出現的頻率,記作3)統計該球內三類溶劑可及性類別的殘基出現的頻率,記作4)將步驟1)至3)中的串聯成一個特征向量;然后,構建樣本集并訓練所搭建的一維卷積神經網絡;最后,將蛋白質結構中殘基的特征向量輸入訓練的模型中,根據模型輸出概率是否大于閾值threshold,進而判斷對應殘基是否為DNA綁定殘基。本發明計算代價小、預測精度高。
技術領域
本發明涉及生物信息學、模式識別與計算機應用領域,具體而言涉及一種基于結構特征的DNA綁定殘基預測方法。
背景技術
蛋白質與配體相互作用在生命過程中是普遍存在且不可或缺的,這種相互作用在生物分子的識別和信號傳遞過程中起著非常重要的作用。DNA分子是重要的一類配體分子,準確識別蛋白質序列中DNA分子的綁定殘基,有助于理解蛋白質功能、分析蛋白質與DNA分子之間的相互作用機制及設計藥物靶蛋白,具有重要的生物學意義。
調研文獻發現,許多用于預測蛋白質序列中DNA綁定殘基的方法已被提出,如:DNAPred(Zhu Y,Hu J,Song X,et al.DNAPred:Accurate Identification of DNA-Binding Sites from Protein Sequence by Ensembled Hyperplane-Distance-BasedSupport Vector Machines[J].Journal of Chemical Information and Modeling,2019,59(6):3057-3071.即:Zhu Y等.集成基于超平面距離的支持向量機來準確識別蛋白質序列中的DNA綁定位點[J].化學信息和建模期刊,2019,59(6):3057-3071)、EL_PSSM-RT(ZhouJ,Lu Q,Xu R,et al.EL_PSSM-RT:DNA-binding residue prediction by integratingensemble learning with PSSM Relation Transformation[J].BMC Bioinformatics,2017,18(1):1-16.即:Zhou J等.通過結合集成學習與PSSM關系轉化預測DNA綁定殘基[J].生物信息學,2017,18(1):1-16)、CNNsite(Zhou J,Lu Q,Xu R,et al.CNNsite:predictionof DNA-binding residues in proteins using convolutional neural network withsequence features[J],2016:78-85.即:Zhou J等.基于序列特征的卷積神經網絡預測蛋白質DNA綁定殘基[J],2016:78-85)、DP-Bind(Hwang S,Gou Z,Kuznetsov A I B.DP-Bind:a web server for sequence-based prediction of DNA-binding residues in DNA-binding proteins.[J].Bioinformatics,2007,23(5):634-636.即:Hwang S等.一個基于序列的蛋白質DNA綁定殘基預測服務器[J].生物信息學,2017,23(5):634-636)等。盡管已有方法可以用于預測蛋白質序列中的DNA綁定殘基,但是蛋白質的三維結構信息沒有得到足夠的關注,預測精度并不能保證是最優的,有待進一步提升。
綜上所述,已有的DNA綁定殘基的預測方法在計算代價、預測精度兩個方面距離實際應用的要求還有很大差距,迫切地需要改進。
發明內容
為了克服已有的DNA綁定殘基預測方法在計算代價、預測精度兩個方面的不足,本發明提出一種計算代價小、預測精度高的基于結構特征的DNA綁定殘基預測方法。
本發明解決其技術問題所采用的技術方案是:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江工業大學,未經浙江工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110081107.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:多級循環載荷作用下材料疲勞壽命預測方法
- 下一篇:一種地熱能分布式供能系統





