[發(fā)明專利]一種快速虛擬篩選人體小腸易吸收藥物的方法有效
| 申請?zhí)枺?/td> | 201510069837.6 | 申請日: | 2015-02-10 |
| 公開(公告)號: | CN104636619B | 公開(公告)日: | 2017-11-14 |
| 發(fā)明(設(shè)計)人: | 朱祥偉 | 申請(專利權(quán))人: | 青島農(nóng)業(yè)大學(xué) |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 青島中天匯智知識產(chǎn)權(quán)代理有限公司37241 | 代理人: | 郝團(tuán)代 |
| 地址: | 266000 山*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 快速 虛擬 篩選 人體 小腸 吸收 藥物 方法 | ||
1.一種快速虛擬篩選人體小腸易吸收藥物的方法,其特征在于,包括以下步驟:
一、化合物小腸吸收數(shù)據(jù)庫的優(yōu)化:將已有的化合物分子結(jié)構(gòu)及其小腸吸收率數(shù)值收集形成化合物小腸吸收數(shù)據(jù)庫,分別對化合物數(shù)據(jù)的結(jié)構(gòu)與活性進(jìn)行優(yōu)化,得到具有明確的小腸吸收率的單一化合物數(shù)據(jù)庫,化合物的分子量集中在50~500之間;所述優(yōu)化方式為剔除有機(jī)金屬化合物、混合物,消除順反異構(gòu),消除化合物結(jié)構(gòu)手性碳結(jié)構(gòu),將剩余的所有化合物結(jié)構(gòu)都標(biāo)準(zhǔn)化,經(jīng)過排序,對于小腸吸收率相同的重復(fù)化合物保留一個,對于吸收率數(shù)值不同的重復(fù)化合物,根據(jù)其重復(fù)個數(shù),若重復(fù)數(shù)目為2,計算兩重復(fù)化合物小腸吸收率的平均值M,若|S1-M|/M>0.20,則表示活性值差異大,舍棄該化合物,若|S1-M|/M在0.20以內(nèi),則以平均值M為該化合物實(shí)際小腸吸收率;若重復(fù)化合物數(shù)目為3個或超過3個,則采用狄克遜Dixon檢驗(yàn)法,剔出異常值后,對剩余小腸吸收值取平均值代表該化合物實(shí)際的小腸吸收率,S1表示兩化合物中一個的吸收率;
二、描述符計算與變量預(yù)處理:將步驟一所得化合物信息利用不同的化合物描述符計算軟件,計算不同類型的描述符,為解決描述符中存在大量的近似常量或共線性高的變量,首先利用如下方法對描述符進(jìn)行歸一化處理xs=(xi-xmin)/(xmax-xmin),其中,xs為歸一化后描述符的值,xi為描述符原始值,xmax與xmin分別表示描述符的最大與最小值,通過上述公式xs=(xi-xmin)/(xmax-xmin)將描述符值歸一到0到1之間,同時記錄每個描述符的最小值xmin和最大值xmax,刪除標(biāo)準(zhǔn)偏差小于0.001的描述符,若兩個描述符的相關(guān)性大于0.90,則刪除其中一個;
三、重要變量篩選及線性模型構(gòu)建:基于步驟一中得到的化合物活性數(shù)據(jù)和步驟二中計算的結(jié)構(gòu)描述符數(shù)據(jù)利用變量篩選方法,對每個類型的描述符變量依重要性大小進(jìn)行排序,挑選部分重要描述符,以化合物的小腸吸收率為因變量,采用多元線性回歸方法構(gòu)建的預(yù)測化合物小腸吸收率的線性方程模型,對于每種類型的描述符,構(gòu)建一組多元線性回歸方程;
四、預(yù)測藥物前導(dǎo)化合物的人小腸吸收率:藥物前導(dǎo)化合物分子結(jié)構(gòu)按照步驟一中的結(jié)構(gòu)優(yōu)化方法優(yōu)化,按步驟二中的軟件計算藥物前導(dǎo)化合物的化學(xué)結(jié)構(gòu)描述符,依據(jù)步驟二中記錄每種描述符的最小值xmin和最大值xmax,對藥物前導(dǎo)化合物的描述符進(jìn)行歸一化處理,最終依步驟三選取的重要描述符,將新化合物中對應(yīng)描述符的數(shù)值代入步驟三構(gòu)建的多元線性回歸方程,計算出活性,即該藥物前導(dǎo)化合物的人小腸吸收率預(yù)測值,同時,將不同線性方程的預(yù)測值平均,即是藥物前導(dǎo)化合物分子的最終小腸吸收預(yù)測值。
2.根據(jù)權(quán)利要求1所述的快速虛擬篩選人體小腸易吸收藥物的方法,其特征在于:所述不同類型的描述符是指:各種依據(jù)有機(jī)化合物的分子結(jié)構(gòu)計算其相關(guān)參數(shù)的結(jié)構(gòu)描述符,包括一維、二維、三維的化學(xué)結(jié)構(gòu)描述符。
3.根據(jù)權(quán)利要求1所述的快速虛擬篩選人體小腸易吸收藥物的方法,其特征在于:所述變量篩選方法包括簡單的逐步回歸到復(fù)雜的機(jī)器學(xué)習(xí)方法,可以針對所有描述符的重要性進(jìn)行定量化排序的變量篩選方法。
4.根據(jù)權(quán)利要求1所述的快速虛擬篩選人體小腸易吸收藥物的方法,其特征在于:所述挑選部分重要描述符是指:依據(jù)描述符重要性排序,從最重要描述符進(jìn)行始挑選,其最終用于構(gòu)建多元線性回歸模型的描述符個數(shù)不超過建模化合物數(shù)目的10%。
5.根據(jù)權(quán)利要求1所述的快速虛擬篩選人體小腸易吸收藥物的方法,其特征在于:所述步驟二經(jīng)預(yù)處理后,得到388個具有準(zhǔn)確小腸吸收率的單一化合物。
6.根據(jù)權(quán)利要求1所述的快速虛擬篩選人體小腸易吸收藥物的方法,其特征在于:所述步驟二中采用Dragon和CDK兩種描述符計算軟件,所述步驟三中利用隨機(jī)森林法進(jìn)行經(jīng)變量篩選,選取10個重要的Dragon描述符為自變量,以化合物的小腸吸收率為因變量,構(gòu)建線性方程模型,公式1:
y=1.126(±0.0743)+1.145(±0.196)*TPSA(Tot)-0.339(±0.143)*Hy-0.338(±0.0936)*F03[N-O]+0.00850(±0.176)*nO-0.0624(±0.0935)*ALOGP-0.326(±0.0920)*O-057+0.330(±0.315)*nROH+0.741(±0.274)*T(N..O)+0.495(±0.252)*T(O..O)-0.803(±0.299)*O-056,擬合誤差為0.163,其中,TPSA(Tot)表示拓?fù)錁O性表面積(N,O,S,P);Hy表示親水性;F03[N-O]表示N與O拓?fù)渚嚯x為3的結(jié)構(gòu)數(shù)目;nO表示氧原子數(shù)目;ALOGP表示Ghose-Crippen辛醇-水分配系數(shù);O-057表示酚、醇及羧酸中的OH;nROH表示羥基數(shù)目;T(N..O)表示N與O拓?fù)淇偩嚯x;T(O..O)表示O與O拓?fù)淇偩嚯x;O-056表示乙醇基團(tuán);
選取10個重要的CDK描述符為自變量,以化合物的小腸吸收率為因變量,構(gòu)建線性模型,公式2:
y=1.070(±0.0521)-1.090(±0.293)*TopoPSA-0.800(±0.186)*nHBDon-0.742(±0.111)*MDEO-11+0.515(±0.211)*nHBAcc-0.0570(±0.151)*khs.sOH+1.118(±0.268)*WTPT-4-0.0434(±0.0820)*XLogP-1.390(±0.356)*ATSc1-0.0401(±0.0413)*khs.aaNH+0.388(±0.296)*WTPT-3,其中,TopoPSA表示拓?fù)錁O性表面積;nHBDon表示氫鍵供體數(shù)目;MDEO-11表示C,N與O的分子距離指數(shù);nHBAcc表示氫鍵受體數(shù)目;khs.sOH,表示E-state碎片數(shù)目;WTPT-4表示Randic路徑加權(quán)指數(shù);XLogP表示基于原子類型計算的辛醇-水分配系數(shù);ATSc1和Khs.aaNH表示沒有明確含義;WTPT-3表示Randic路徑指數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于青島農(nóng)業(yè)大學(xué),未經(jīng)青島農(nóng)業(yè)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510069837.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 確定吸收制品功效
- 一種虛擬機(jī)的安全訪問方法及虛擬機(jī)系統(tǒng)
- 一種虛擬桌面的解鎖方法及裝置
- 一種實(shí)時處理虛擬交換機(jī)網(wǎng)絡(luò)流量的虛擬化平臺
- 虛擬智能家居實(shí)訓(xùn)系統(tǒng)及其虛擬實(shí)訓(xùn)方法
- 虛擬機(jī)的磁盤資源的管理方法和裝置
- 一種基于KVM的虛擬網(wǎng)卡管理方法
- 虛擬資源數(shù)據(jù)處理方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 基于虛擬環(huán)境的道具使用方法、裝置、設(shè)備及介質(zhì)
- 虛擬道具的獲取方法、裝置、設(shè)備及介質(zhì)





