[發明專利]基于多元線性回歸快速預測黃嘌呤衍生物抑制活性的QSAR方法有效
| 申請號: | 202010881483.6 | 申請日: | 2020-08-27 |
| 公開(公告)號: | CN112151111B | 公開(公告)日: | 2022-10-11 |
| 發明(設計)人: | 趙娟娟;劉秀娟;陸文聰 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G16B15/00 | 分類號: | G16B15/00;G16B40/00 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多元 線性 回歸 快速 預測 黃嘌呤 衍生物 抑制 活性 qsar 方法 | ||
1.一種基于多元線性回歸快速預測黃嘌呤衍生物抑制活性的QSAR方法,其特征在于,包括如下步驟:
1)利用計算機系統,從文獻中查找能夠抑制DPP-IV活性的黃嘌呤衍生物結構及其對應的IC50值,作為數據集樣本;
2)用Chemdraw畫出收集到的黃嘌呤結構,再用Dragon軟件生成描述符;
3)以IC50值的負對數為目標變量,Dragon生成的描述符為自變量,以互信息閾值為0.45初步篩選數據集;對初步篩選的數據集,隨機劃分訓練集和測試集,測試集的比例占整個數據集的20%;
4)利用最大相關最小冗余方法結合多元線性回歸留一法,驗證篩選變量,選出建模的最優變量子集;
5)對篩選出的最優自變量進行轉換,獲得新的自變量;
6)在生成新的描述符的基礎上,用多元線性回歸方法,建立黃嘌呤衍生物抑制活性的快速預報模型;
7)根據建立的黃嘌呤衍生物的快速預報模型和待檢測的黃嘌呤衍生物,快速預報待檢測物的抑制活性;
所述步驟5)中獲得的新的自變量為:
P(1)=+0.5318X1+0.1015X2+0.01403X3+3.751X4+0.08761X5+0.08958X6+0.5885X7+0.1830X8+0.004620X9+0.9556X10-51.580
P(2)=-0.7803X1-0.2487X2-0.005499X3+4.865X4+0.01781X5+0.06662X6+0.2001X7+0.09473X8-0.006231X9+0.7070X10-16.425
P(3)=-1.326X1+0.2069X2-0.01321X3+5.587X4-0.006104X5+0.05154X6+0.3427X7-0.002190X8-0.008101X9+0.6040X10-8.878
P(4)=-1.085X1+0.04423X2+0.0003891X3+5.462X4-0.1017X5-0.02304X6+0.1587X7-0.2447X8+0.005499X9+1.322X10-10.836
P(5)=-0.1980X1-0.01055X2-0.02453X3+8.016X4-0.09841X5-0.004190X6+0.9428X7-0.3690X8+0.006330X9+0.1503X10-24.193
P(6)=-0.5804X1-0.006145X2+0.0003567X3+8.097X4-0.1426X5+0.04710X6+0.5413X7-0.1006X8+0.007435X9-1.881X10-7.663
P(7)=-0.9359X1-0.05420X2+0.01620X3+2.366X4-0.0156X5-0.04107X6+1.580X7-0.1670X8+0.003524X9-1.594X10+15.090
P(8)=+0.4573X1+0.002638X2+0.02015X3+2.915X4-0.1471X5-0.09858X6+0.7866X7-0.01202X8-0.006955X9-0.1316X10-12.377
P(9)=-0.09285X1-0.005898X2-0.006817X3-3.525X4-0.1834X5+0.01118X6+0.9294X7+0.2454X8+0.0009003X9+0.4599X10+10.845。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010881483.6/1.html,轉載請聲明來源鉆瓜專利網。





