[發(fā)明專利]一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)化合物人體屏障通透性的方法在審
| 申請(qǐng)?zhí)枺?/td> | 202210005174.1 | 申請(qǐng)日: | 2022-01-05 |
| 公開(公告)號(hào): | CN114360660A | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計(jì))人: | 莊樹林;高雨晨;趙啟明;茍藝源;張家晨 | 申請(qǐng)(專利權(quán))人: | 浙江大學(xué) |
| 主分類號(hào): | G16C20/30 | 分類號(hào): | G16C20/30;G06N20/00 |
| 代理公司: | 杭州天勤知識(shí)產(chǎn)權(quán)代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機(jī)器 學(xué)習(xí) 預(yù)測(cè) 化合物 人體 屏障 通透 方法 | ||
本發(fā)明公開了一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)化合物人體屏障通透性的方法,所述的人體屏障通透性為血腦屏障通透性,包括:(1)建立化合物血腦屏障通透性評(píng)價(jià)標(biāo)準(zhǔn);(2)得到樣本標(biāo)簽和樣本數(shù)據(jù);(3)基于機(jī)器學(xué)習(xí)構(gòu)建預(yù)測(cè)模型,利用樣本數(shù)據(jù)對(duì)預(yù)測(cè)模型在樣本標(biāo)簽的監(jiān)督下進(jìn)行訓(xùn)練,優(yōu)化預(yù)測(cè)模型參數(shù);(4)預(yù)測(cè)待測(cè)化合物的血腦屏障通透性。本發(fā)明通過建立化合物血腦屏障通透性標(biāo)準(zhǔn),將樣本按照是否具有血腦屏障通透性進(jìn)行分類,再建立化合物分子結(jié)構(gòu)特征與其血腦屏障通透性的預(yù)測(cè)模型來預(yù)測(cè)化合物的血腦屏障通透性,預(yù)測(cè)準(zhǔn)確度高,應(yīng)用范圍較廣,打破了現(xiàn)有技術(shù)中血腦屏障滲透性預(yù)測(cè)模型僅針對(duì)藥物建立、僅應(yīng)用于藥物血腦屏障通透性預(yù)測(cè)的現(xiàn)狀。
技術(shù)領(lǐng)域
本發(fā)明屬于化合物屬性預(yù)測(cè)技術(shù)領(lǐng)域,尤其涉及一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)化合物人體屏障通透性的方法。
背景技術(shù)
腦組織與血液之間形成的可以選擇性阻礙物質(zhì)通過的動(dòng)態(tài)屏障叫做血腦屏障(BBB),可以阻斷絕大部分外源性物質(zhì)由血液進(jìn)入腦組織,從而保持腦組織環(huán)境與中樞神經(jīng)系統(tǒng)生理狀態(tài)。然而,傳統(tǒng)的實(shí)驗(yàn)方法測(cè)定化合物腦血分配系數(shù)成本高并且耗時(shí)長(zhǎng),無法應(yīng)用于高通量篩選。鑒于體外血腦屏障實(shí)驗(yàn)?zāi)P蜆?gòu)建的復(fù)雜程度,亟需一種能夠高通量判定化合物血腦屏障通透性的非實(shí)驗(yàn)預(yù)測(cè)方法,因此采用計(jì)算手段預(yù)測(cè)化合物血腦屏障通透性對(duì)于輔助藥物設(shè)計(jì)、污染物心腦血管健康風(fēng)險(xiǎn)評(píng)估等領(lǐng)域具有廣泛的應(yīng)用前景。
公開號(hào)為CN112750510A的中國專利文獻(xiàn)公開了一種藥物血腦屏障滲透性的預(yù)測(cè)方法;該發(fā)明結(jié)合基團(tuán)貢獻(xiàn)法與人工神經(jīng)網(wǎng)絡(luò),建立人工神經(jīng)網(wǎng)絡(luò)模型,利用藥物的分子描述符來預(yù)測(cè)其血腦屏障滲透參數(shù)logBB。該發(fā)明中,分子描述符包括分子結(jié)構(gòu)基團(tuán)描述符、物理化學(xué)性能描述符和生物學(xué)描述符,且分子結(jié)構(gòu)基團(tuán)描述符通過UNIFAC基團(tuán)貢獻(xiàn)法拆分獲得各個(gè)分子基團(tuán)得到;人工神經(jīng)網(wǎng)絡(luò)為2層隱藏層的ANN。
公開號(hào)為CN112802561A的中國專利文獻(xiàn)公開了一種基于機(jī)器學(xué)習(xí)和集成方法的化合物血腦屏障滲透性預(yù)測(cè)方法:首先進(jìn)行特征提取,將待檢測(cè)的化合物通過分子指紋生成軟件生成指紋序列;再通過低變異特征過濾和高度相關(guān)特征過濾進(jìn)行特征選擇;隨后采用支持向量機(jī)(SVM)、隨機(jī)森林(RF)以及極限梯度提升(XGBoost)分別構(gòu)建三種基分類器模型;最后采用集成方法優(yōu)化模型。該發(fā)明方法預(yù)測(cè)準(zhǔn)確度高,但方法較為復(fù)雜。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)化合物人體屏障通透性的方法,打破了現(xiàn)有技術(shù)中血腦屏障滲透性預(yù)測(cè)模型僅針對(duì)藥物建立、僅應(yīng)用于藥物血腦屏障通透性預(yù)測(cè)的現(xiàn)狀,且應(yīng)用范圍廣、預(yù)測(cè)時(shí)間成本低、準(zhǔn)確度高,可實(shí)現(xiàn)批量預(yù)測(cè)。
具體采用的技術(shù)方案如下:
一種基于機(jī)器學(xué)習(xí)預(yù)測(cè)化合物人體屏障通透性的方法,所述的人體屏障通透性為血腦屏障通透性,包括以下步驟:
(1)建立化合物血腦屏障通透性評(píng)價(jià)標(biāo)準(zhǔn);
(2)采集化合物建立B3DataBase數(shù)據(jù)集,清洗數(shù)據(jù)集后根據(jù)步驟(1)建立的標(biāo)準(zhǔn)評(píng)價(jià)數(shù)據(jù)集中的樣本是否具有血腦屏障通透性,將評(píng)價(jià)結(jié)果作為樣本標(biāo)簽;導(dǎo)出樣本的SMILES表達(dá)式后提取樣本的特異性分子特征作為樣本數(shù)據(jù),對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理;
(3)基于機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型,利用預(yù)處理后的樣本數(shù)據(jù)對(duì)預(yù)測(cè)模型在樣本標(biāo)簽的監(jiān)督下進(jìn)行訓(xùn)練,以優(yōu)化預(yù)測(cè)模型參數(shù);所述的機(jī)器學(xué)習(xí)算法為多層感知機(jī)網(wǎng)絡(luò);
(4)導(dǎo)出待測(cè)化合物的SMILES表達(dá)式后提取待測(cè)化合物的特異性分子特征,作為待測(cè)數(shù)據(jù)輸入至參數(shù)優(yōu)化的預(yù)測(cè)模型中,預(yù)測(cè)待測(cè)化合物的血腦屏障通透性。
本發(fā)明方法通過建立化合物血腦屏障通透性標(biāo)準(zhǔn),將樣本按照是否具有血腦屏障通透性進(jìn)行分類,再基于多層感知機(jī)網(wǎng)絡(luò)建立化合物分子結(jié)構(gòu)特征與其血腦屏障通透性的預(yù)測(cè)模型,實(shí)現(xiàn)化合物血腦屏障通透性的批量預(yù)測(cè);其中,分類操作可以降低計(jì)算復(fù)雜度、提高計(jì)算的穩(wěn)定性;且本發(fā)明方法無需進(jìn)行動(dòng)物或細(xì)胞實(shí)驗(yàn),模型分類能力優(yōu)異、預(yù)測(cè)準(zhǔn)確度高。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210005174.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時(shí)間序列預(yù)測(cè)模型適用性量化的預(yù)測(cè)模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測(cè)方法及裝置、預(yù)測(cè)模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測(cè)的方法及裝置
- 圖像預(yù)測(cè)方法及裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 文本預(yù)測(cè)方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





