[發明專利]基于多元線性回歸快速預測黃嘌呤衍生物抑制活性的QSAR方法有效
| 申請號: | 202010881483.6 | 申請日: | 2020-08-27 |
| 公開(公告)號: | CN112151111B | 公開(公告)日: | 2022-10-11 |
| 發明(設計)人: | 趙娟娟;劉秀娟;陸文聰 | 申請(專利權)人: | 上海大學 |
| 主分類號: | G16B15/00 | 分類號: | G16B15/00;G16B40/00 |
| 代理公司: | 上海上大專利事務所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 多元 線性 回歸 快速 預測 黃嘌呤 衍生物 抑制 活性 qsar 方法 | ||
本發明涉及一種基于多元線性回歸快速預測黃嘌呤衍生物抑制活性的QSAR方法,建立數據集樣本;生成描述符;隨機劃分訓練集和測試集;利用最大相關最小冗余方法結合多元線性回歸留一法驗證篩選變量,選出建模的最優變量子集;對篩選出的最優自變量進行轉換,獲得新的自變量;用多元線性回歸建立黃嘌呤衍生物抑制活性的快速預報模型;根據建立的黃嘌呤衍生物的快速預報模型和待檢測的黃嘌呤衍生物,快速預報待檢測物的抑制活性。本發明基于可靠的文獻真實值和建模方法,所建的黃嘌呤衍生物抑制活性的預報模型具有方便快捷,無化學污染等優點。
技術領域
本發明涉及黃嘌呤衍生物抑制活性的預測,特別是一種基于多元線性回歸快速預測黃嘌呤衍生物抑制活性的定量構效關系(quantitative structure activityrelationship,簡稱QSAR)方法。
技術背景
黃嘌呤衍生物屬于二肽基肽酶IV(dipeptidyl peptidase IV,簡稱DPP-IV)抑制劑的其中一種,有降低糖尿病患者血糖水平的作用。DPP-IV是一種絲氨酸蛋白酶,能夠從多肽的N-末端分裂出X-脯氨酸二肽(X為任意氨基酸)。當人們在進餐后,體內血糖升高,葡萄糖依賴性的胰高血糖素樣肽1(GLP-1)能刺激胰島β細胞分泌胰島素,但其大部分被DPP-IV降解失活。黃嘌呤衍生物作為DPP-IV抑制劑中的一種,能夠抑制DPP-IV的活性。因具有降糖作用,黃嘌呤衍生物受到人們的關注。
半抑制活性濃度(IC50)是指被測量的拮抗劑的半抑制濃度,即某一種藥物或者物質(抑制劑)在抑制某些生物程序(或者是包括在此程序中的某些物質,如酶,細胞受體或微生物)的半量。IC50值越低,意味著此抑制劑的抑制活性效果越好。
定量構效關系(quantitative structure activity relationship,簡稱QSAR)作為一種統計模型,是用來分析分子結構與分子的某種活性之間的關系,包含與機器學習方法的結合,已經廣泛用于藥物發現和先導物優化中。
最大相關最小冗余(mRMR)是一種常見的用于自變量篩選的方法。該方法是基于所選擇的特征之間的冗余度應最小,與目標變量之間的相關性最大的理論來篩選自變量。
多元線性回歸(multiple linear regression,簡稱MLR)是多元數據分析的傳統標準方法。該算法通過建立因變量和多個自變量之間的回歸模型,從而得到線性方程,最終可以用來預測新的數據。如何應用多元線性回歸建模,實現快速預報待檢測物的抑制活性,成為亟待解決的技術問題。
發明內容
本發明的目的是為了克服現有技術存在的缺陷,提供一種基于多元線性回歸快速預測黃嘌呤衍生物的抑制活性QSAR方法,通過計算黃嘌呤衍生物二維結構的描述符,利用最大相關最小冗余篩選變量,并借助多元線性回歸算法建模,預測黃嘌呤衍生物的pIC50值,IC50值的負對數。通過這些方法能幾分鐘就可得到結果,方便快捷,無需實驗和繁雜的計算。
本發明的目的可通過如下的技術方案實現:
一種基于多元線性回歸快速預測黃嘌呤衍生物抑制活性的QSAR方法,包括如下步驟:
1)利用計算機系統,從文獻中查找能夠抑制DPP-IV活性的黃嘌呤衍生物結構及其對應的IC50值,作為數據集樣本;
2)用Chemdraw畫出收集到的黃嘌呤結構,再用Dragon軟件生成描述符;
3)以IC50值的負對數(pIC50)為目標變量,Dragon生成的描述符為自變量,以互信息閾值為0.45初步篩選數據集;對初步篩選的數據集,隨機劃分訓練集和測試集,測試集的比例占整個數據集的20%;
4)利用最大相關最小冗余方法結合多元線性回歸留一法驗證篩選變量,選出建模的最優變量子集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海大學,未經上海大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010881483.6/2.html,轉載請聲明來源鉆瓜專利網。





