[發(fā)明專利]一種基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法在審
| 申請?zhí)枺?/td> | 202210005174.1 | 申請日: | 2022-01-05 |
| 公開(公告)號: | CN114360660A | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計(jì))人: | 莊樹林;高雨晨;趙啟明;茍藝源;張家晨 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | G16C20/30 | 分類號: | G16C20/30;G06N20/00 |
| 代理公司: | 杭州天勤知識產(chǎn)權(quán)代理有限公司 33224 | 代理人: | 胡紅娟 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 機(jī)器 學(xué)習(xí) 預(yù)測 化合物 人體 屏障 通透 方法 | ||
1.一種基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,所述的人體屏障通透性為血腦屏障通透性,包括以下步驟:
(1)建立化合物血腦屏障通透性評價標(biāo)準(zhǔn);
(2)采集化合物建立B3DataBase數(shù)據(jù)集,清洗數(shù)據(jù)集后根據(jù)步驟(1)建立的標(biāo)準(zhǔn)評價數(shù)據(jù)集中的樣本是否具有血腦屏障通透性,將評價結(jié)果作為樣本標(biāo)簽;導(dǎo)出樣本的SMILES表達(dá)式后提取樣本的特異性分子特征作為樣本數(shù)據(jù),對樣本數(shù)據(jù)進(jìn)行預(yù)處理;
(3)基于機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測模型,利用預(yù)處理后的樣本數(shù)據(jù)對預(yù)測模型在樣本標(biāo)簽的監(jiān)督下進(jìn)行訓(xùn)練,以優(yōu)化預(yù)測模型參數(shù);所述的機(jī)器學(xué)習(xí)算法為多層感知機(jī)網(wǎng)絡(luò);
(4)導(dǎo)出待測化合物的SMILES表達(dá)式后提取待測化合物的特異性分子特征,作為待測數(shù)據(jù)輸入至參數(shù)優(yōu)化的預(yù)測模型中,預(yù)測待測化合物的血腦屏障通透性。
2.根據(jù)權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,步驟(1)中,所述的化合物血腦屏障通透性標(biāo)準(zhǔn)為:當(dāng)logBB>-1時,表示該化合物具有血腦屏障通透性;當(dāng)logBB≤-1時,表示該化合物不具有血腦屏障通透性;其中,
logBB=Cblood/Cbrain
logBB為腦血分配系數(shù),Cblood為血液中化合物濃度,Cbrain為腦組織中化合物濃度。
3.根據(jù)權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,步驟(2)中,化合物采集于文獻(xiàn)實(shí)驗(yàn)數(shù)據(jù)或化合物數(shù)據(jù)庫。
4.根據(jù)權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,清洗數(shù)據(jù)集的步驟為:對B3DataBase數(shù)據(jù)集去除重復(fù)分子、中性分子、鹽類以及含有重金屬的分子;對于擁有超過1個logBB值的樣本:如果logBB值有2個,則取加權(quán)平均值;如果logBB值多于2個,則選取出現(xiàn)頻率最高的logBB值。
5.根據(jù)權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,所述的特異性分子特征包括分子描述符和\或一種或多種分子指紋。
6.根據(jù)權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,步驟(3)中,將預(yù)處理后的樣本數(shù)據(jù)劃分為訓(xùn)練集和測試集,利用訓(xùn)練集訓(xùn)練所述的預(yù)測模型,利用測試集評價預(yù)測模型優(yōu)度,優(yōu)化預(yù)測模型參數(shù)。
7.根據(jù)權(quán)利要求1所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,所述的多層感知機(jī)網(wǎng)絡(luò)包括輸入層、隱藏層和輸出層,所述的隱藏層為1層,神經(jīng)元節(jié)點(diǎn)數(shù)為75個。
8.根據(jù)權(quán)利要求7所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法,其特征在于,隱藏層的傳遞函數(shù)為relu激活函數(shù),adam算法作為權(quán)重優(yōu)化路徑。
9.根據(jù)權(quán)利要求1-8任一所述的基于機(jī)器學(xué)習(xí)預(yù)測化合物人體屏障通透性的方法在預(yù)測化合物血腦屏障通透性中的應(yīng)用。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210005174.1/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 根據(jù)用戶學(xué)習(xí)效果動態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲介質(zhì)
- 游戲?qū)W習(xí)效果評測方法及系統(tǒng)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法、程序以及記錄介質(zhì)
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 基于時間序列預(yù)測模型適用性量化的預(yù)測模型選擇方法
- 圖像編碼裝置、圖像編碼方法、圖像譯碼裝置、圖像譯碼方法
- 分類預(yù)測方法及裝置、預(yù)測模型訓(xùn)練方法及裝置
- 幀內(nèi)預(yù)測的方法及裝置
- 圖像預(yù)測方法及裝置、電子設(shè)備和存儲介質(zhì)
- 文本預(yù)測方法、裝置以及電子設(shè)備
- 模型融合方法、預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)





