[發(fā)明專利]定量構(gòu)效關(guān)系輔助匹配分子對分析方法在審
| 申請?zhí)枺?/td> | 202010098622.8 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN111341390A | 公開(公告)日: | 2020-06-26 |
| 發(fā)明(設(shè)計)人: | 曹東升;付麗;楊梓宜 | 申請(專利權(quán))人: | 中南大學(xué) |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/70 |
| 代理公司: | 長沙軒榮專利代理有限公司 43235 | 代理人: | 李喆 |
| 地址: | 410000 湖南*** | 國省代碼: | 湖南;43 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 定量 關(guān)系 輔助 匹配 分子 分析 方法 | ||
1.一種定量構(gòu)效關(guān)系輔助匹配分子對分析方法,其特征在于,包括:
步驟1,對分子的結(jié)構(gòu)進行清洗、除鹽、去復(fù)合物,收集實驗數(shù)據(jù),并對所述實驗數(shù)據(jù)進行預(yù)處理;
步驟2,計算分子描述符,根據(jù)所述分子描述符建立定量構(gòu)效關(guān)系模型;
步驟3,根據(jù)所述定量構(gòu)效關(guān)系模型預(yù)測現(xiàn)有的數(shù)據(jù)庫,擴增實驗數(shù)據(jù);
步驟4,選出預(yù)測準(zhǔn)確的分子,將標(biāo)準(zhǔn)偏差作為到定量構(gòu)效關(guān)系模型的距離,從而評估模型的應(yīng)用域;
步驟5,將挑選出來預(yù)測準(zhǔn)確的數(shù)據(jù)和收集的實驗數(shù)據(jù)混合進行匹配分子對分子。
2.根據(jù)權(quán)利要求1所述的定量構(gòu)效關(guān)系輔助匹配分子對分析方法,其特征在于,所述步驟1還包括:
對分子結(jié)構(gòu)進行標(biāo)準(zhǔn)化處理,如一個分子對應(yīng)多個目標(biāo)值,則取中位數(shù)。
3.根據(jù)權(quán)利要求2所述的定量構(gòu)效關(guān)系輔助匹配分子對分析方法,其特征在于,所述步驟2具體包括:
使用極度梯度提升樹、支持向量機、隨機森林、Cubist、相關(guān)向量機、梯度提升樹、深度學(xué)習(xí)、高斯建立分類或回歸預(yù)測模型;
對上述方法進行排列組合,通過求算數(shù)平均值建立共識模型;
選擇預(yù)測能力最好的共識模型作為最后的預(yù)測模型。
4.根據(jù)權(quán)利要求3所述的定量構(gòu)效關(guān)系輔助匹配分子對分析方法,其特征在于,所述步驟3具體包括:
預(yù)測小分子化合物數(shù)據(jù)庫,將收集的實驗數(shù)據(jù)集按照80%和20%的比例進行隨機批分,使用80%訓(xùn)練上述得到的最后的預(yù)測模型來預(yù)測數(shù)據(jù)庫的數(shù)據(jù),重復(fù)多次后,計算多次預(yù)測的均值和標(biāo)準(zhǔn)差。
5.根據(jù)權(quán)利要求4所述的定量構(gòu)效關(guān)系輔助匹配分子對分析方法,其特征在于,所述步驟4具體包括:
將收集的數(shù)據(jù)集按照80%和20%進行隨機批分,使用80%訓(xùn)練上述得到的最好的模型,預(yù)測剩下的20%的數(shù)據(jù),重復(fù)多次后,計算數(shù)據(jù)集中預(yù)測結(jié)果的標(biāo)準(zhǔn)差STD:
其中:Xi為預(yù)測值,μ為預(yù)測的均值,N為循環(huán)的次數(shù);
若標(biāo)準(zhǔn)差小于預(yù)設(shè)值,則表明預(yù)測的結(jié)果準(zhǔn)確;
若標(biāo)準(zhǔn)差大于預(yù)設(shè)值,則表明預(yù)測結(jié)果與實際偏差大。
6.根據(jù)權(quán)利要求5所述的定量構(gòu)效關(guān)系輔助匹配分子對分析方法,其特征在于,所述步驟5具體包括:
將分子所有的非環(huán)單鍵打斷,一部分碎片作為Key,另一部分作為Value;若一個分子被打斷三次以下,Key為固定不變的部分,Value為分子中可以替換的部分;
搜索具有相同Key的兩個分子作為一個匹配分子對,兩個分子之間的局部不同則為一個轉(zhuǎn)換,再匹配上相應(yīng)的兩個分子的活性或者物理化學(xué)性質(zhì),得到該轉(zhuǎn)換導(dǎo)致性質(zhì)變化;
統(tǒng)計每一個轉(zhuǎn)換的分子對數(shù)量,若數(shù)量大于10,則進行秩和檢驗,檢驗所述轉(zhuǎn)換在統(tǒng)計上是否改變了分子的活性或其他性質(zhì);
統(tǒng)計檢驗為有意義的為新的化學(xué)規(guī)則,用于改造先導(dǎo)化合物往預(yù)期的方向發(fā)展。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中南大學(xué),未經(jīng)中南大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010098622.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





