[發明專利]蛋白質與小分子結合位點預測方法、預測裝置有效
| 申請號: | 201910492586.0 | 申請日: | 2019-06-06 |
| 公開(公告)號: | CN110223730B | 公開(公告)日: | 2022-09-27 |
| 發明(設計)人: | 王偉;李克亮;張仕光;呂賀賀;趙遠 | 申請(專利權)人: | 河南師范大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30 |
| 代理公司: | 鄭州睿信知識產權代理有限公司 41119 | 代理人: | 牛愛周 |
| 地址: | 453007 *** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 蛋白質 分子 結合 預測 方法 裝置 | ||
1.蛋白質與小分子結合位點預測方法,其特征在于:包括如下步驟:
1)從蛋白質類數據庫中提取能夠與小分子相互作用的小分子結合蛋白數據集;使用滑動采樣窗口法提取小分子結合蛋白殘基對應特征矩陣,窗口中心位置的殘基如果是結合位點,則采樣窗口所提取的矩陣是正集;窗口中心位置的殘基如果是非結合位點,則采樣窗口所提取的矩陣是負集;
2)將小分子結合蛋白殘基對應特征矩陣轉化為一維向量,構建分類模型;
3)將待測蛋白質對應特征輸入所述的分類模型中,對待測蛋白質的結合位點進行預測。
2.根據權利要求1所述的蛋白質與小分子結合位點預測方法,其特征在于:步驟1)和步驟3)中所述對應特征包括:氨基酸類別、PSSM矩陣、親水性、疏水性和靜電電荷中的一種或多種。
3.根據權利要求1所述的蛋白質與小分子結合位點預測方法,其特征在于:步驟1)中所述滑動采樣窗口法中窗口長度等于13-17。
4.根據權利要求1所述的蛋白質與小分子結合位點預測方法,其特征在于:步驟1)中所述分類模型使用XGBoost算法構建。
5.根據權利要求1所述的蛋白質與小分子結合位點預測方法,其特征在于:步驟1)中所述蛋白質類數據庫為SC-PDB數據庫。
6.根據權利要求1所述的蛋白質與小分子結合位點預測方法,其特征在于:步驟1)中對所有的小分子結合蛋白數據進行去除冗余的處理,得到小分子結合蛋白數據集;具體為:去除同源性≥30%的序列,去除序列長度≤40的序列,去除分辨率≤3?的序列。
7.根據權利要求1所述的蛋白質與小分子結合位點預測方法,其特征在于:步驟1)中篩選出ACO、ADP、ANP、ATP、COA、FAD、FMN、GDP、GNP、NAD、NAP、NDP、SAH和SAM中的一個或多個種類的小分子結合蛋白作為小分子結合蛋白數據集。
8.蛋白質與小分子結合位點預測裝置,其特征在于:包括如下模塊:
用于從蛋白質類數據庫中提取出小分子結合蛋白數據集的模塊;
用于獲得小分子結合蛋白殘基對應特征的模塊;
用于采用滑動采樣窗口法提取小分子結合蛋白殘基對應特征矩陣的模塊;窗口中心位置的殘基如果是結合位點,則采樣窗口所提取的矩陣是正集;窗口中心位置的殘基如果是非結合位點,則采樣窗口所提取的矩陣是負集;
用于將小分子結合蛋白殘基對應特征矩陣轉化為一維向量的模塊;用于構建分類模型的模塊;
用于將待測蛋白質對應特征輸入所述的分類模型中,對待測蛋白質的結合位點進行預測的模塊。
9.根據權利要求8所述的蛋白質與小分子結合位點預測裝置,其特征在于:所述對應特征包括:氨基酸類別、PSSM矩陣、親水性、疏水性和靜電電荷中的一種或多種。
10.根據權利要求8所述的蛋白質與小分子結合位點預測裝置,其特征在于:所述滑動采樣窗口法中窗口長度等于13-17。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南師范大學,未經河南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910492586.0/1.html,轉載請聲明來源鉆瓜專利網。





