[發明專利]高通量平臺和機器學習優化的藥物組合設計方法及裝置有效
| 申請號: | 202210845111.7 | 申請日: | 2022-07-19 |
| 公開(公告)號: | CN114913939B | 公開(公告)日: | 2022-11-15 |
| 發明(設計)人: | 張達威;楊景智;馬菱薇;郝湘平;錢鴻昌 | 申請(專利權)人: | 北京科技大學 |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/60;G16C20/70;G16C20/30;G06F17/18;G06N3/08 |
| 代理公司: | 北京市廣友專利事務所有限責任公司 11237 | 代理人: | 張仲波 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 通量 平臺 機器 學習 優化 藥物 組合 設計 方法 裝置 | ||
1.一種高通量平臺和機器學習優化的藥物組合設計方法,其特征在于,包括以下步驟:
S1:構建用于機器學習的初始訓練數據集,通過所述初始訓練數據集分別對預設的多個機器學習回歸模型進行訓練以及優化,選取最優模型;
所述步驟S1中,構建用于機器學習的初始訓練數據集,通過所述初始訓練數據集分別對預設的多個機器學習回歸模型進行訓練以及優化,選取最優模型,包括:
S11:通過結晶紫染色法,對多個具有抗生物膜性能的D-氨基酸進行表征,篩選出表征性能結果前五的D-氨基酸;
S12:通過高通量平臺將五種D-氨基酸按不同配比組成D-氨基酸混合物,對D-氨基酸混合物的抗生物膜性能進行表征,構建為初始訓練數據集,對所述初始訓練數據集進行歸一化處理;其中,將不同配比的D-氨基酸混合物定義為候選混合物;
S13:通過所述初始訓練數據集對多個機器學習回歸模型分別進行訓練,得到每個機器學習回歸模型的均方誤差值;
S14:通過10倍交叉驗證法對每個機器學習回歸模型的超參數進行調優,選取均方誤差值最小的機器學習回歸模型作為最優模型;
S2:基于最優模型,通過全局優化算法EGO,對候選混合物的抗生物膜性能進行預測,得到候選混合物的性能預測值和預期改善EI值;
S3:以預期改善EI值為標準,對所述候選混合物進行優化,得到目標性能優異的混合物配比,獲得優化候選混合物;
S4:將優化候選混合物與抗生素進行藥物組合,將組合后的藥物進行高通量的性能篩選,篩選出低毒高效的組合方式,完成高通量平臺和機器學習優化的藥物組合設計。
2.根據權利要求1所述的方法,其特征在于,所述初始訓練數據集包括:輸入數據集和輸出數據集;所述輸入數據集為候選混合物中各單元的配比,所述輸出數據集為候選混合物的抗生物膜性能。
3.根據權利要求2所述的方法,其特征在于,所述步驟S2還包括:
通過統計推斷法對每一種候選混合物分別進行n次預測,其中,n≥1000,取預測均值作為性能預測值。
4.根據權利要求1所述的方法,其特征在于,所述步驟S3中,以預期改善EI值為標準,對所述候選混合物的混合物配比進行優化,獲得優化候選混合物,包括:
S31:選取EI值最大的候選混合物的組合方式,作為實驗迭代的候選配方,通過實驗得到候選配方的真實值;
S32:將候選配方的真實值添加到初始訓練數據集中,對初始訓練數據集進行數據擴充;
S33:對擴充后的初始數據集重復執行S2-S32,直到候選配方滿足預設要求,得到目標性能優異的混合物配比,獲得優化候選混合物。
5.根據權利要求4所述的方法,其特征在于,所述預設要求包括:候選混合物的實驗真實值低于初始訓練數據集中的所有值。
6.根據權利要求4所述的方法,其特征在于,所述步驟S4中,將優化候選混合物與抗生素進行藥物組合,將組合后的藥物進行高通量的性能篩選,篩選出低毒高效的組合方式,完成高通量平臺和機器學習優化的藥物組合設計,包括:
S41:通過高通量平臺,利用不同濃度的多種抗生素對細菌耐藥性進行篩選,獲得優化候選混合物與抗生素的藥物組合;
S42:利用高通量平臺對所述藥物組合的抗菌性能以及細胞毒性進行篩選,篩選出低毒高效的組合方式,完成高通量平臺和機器學習優化的藥物組合設計。
7.根據權利要求6所述的方法,其特征在于,所述步驟S42中,所述低毒高效的標準為:在24小時內,藥物組合的抗菌效率大于90%,細胞存活率大于95%。
8.一種高通量平臺和機器學習優化的藥物組合設計裝置,其特征在于,所述裝置適用于權利要求1-7中任意一項所述的方法,裝置包括:
模型訓練模塊,用于構建用于機器學習的初始訓練數據集,通過所述初始訓練數據集分別對預設的多個機器學習回歸模型進行訓練以及優化,選取最優模型;
模型訓練模塊,用于通過結晶紫染色法,對多個具有抗生物膜性能的D-氨基酸進行表征,篩選出表征性能結果前五的D-氨基酸;
通過高通量平臺將五種D-氨基酸按不同配比組成D-氨基酸混合物,對D-氨基酸混合物的抗生物膜性能進行表征,構建為初始訓練數據集,對所述初始訓練數據集進行歸一化處理;其中,將不同配比的D-氨基酸混合物定義為候選混合物;
通過所述初始訓練數據集對多個機器學習回歸模型分別進行訓練,得到每個機器學習回歸模型的均方誤差值;
通過10倍交叉驗證對每個機器學習回歸模型的超參數進行調優,選取均方誤差值最小的機器學習回歸模型作為最優模型;
性能預測模塊,用于確定最優模型中的算法,通過所述算法對候選混合物的抗生物膜性能進行預測,獲得預期改善EI值;
配比優化模塊,用于基于最優模型,通過全局優化算法EGO,對候選混合物的抗生物膜性能進行預測,得到候選混合物的性能預測值和預期改善EI值;
藥物組合模塊,用于將優化候選混合物與抗生素進行藥物組合,將組合后的藥物進行高通量的性能篩選,篩選出低毒高效的組合方式,完成高通量平臺和機器學習優化的藥物組合設計。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京科技大學,未經北京科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210845111.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:吊鉤姿態調整系統、方法、塔機起重機
- 下一篇:一種型材穿條機及其使用方法





