[發明專利]一種基于機器學習和分子對接技術的抗癌中藥篩選方法有效
| 申請號: | 202210148367.2 | 申請日: | 2022-02-17 |
| 公開(公告)號: | CN114203269B | 公開(公告)日: | 2022-05-10 |
| 發明(設計)人: | 吳嘉瑞;段小霞;沈亮亮;劉鑫馗;馮秋紅 | 申請(專利權)人: | 北京澤橋醫療科技股份有限公司 |
| 主分類號: | G16C20/70 | 分類號: | G16C20/70;G16B40/00;G16B30/00;G16B5/00;C12Q1/6886 |
| 代理公司: | 北京知呱呱知識產權代理有限公司 11577 | 代理人: | 杜立軍 |
| 地址: | 100176 北京市大興區北京經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 分子 對接 技術 抗癌 中藥 篩選 方法 | ||
1.一種基于機器學習和分子對接技術的抗癌中藥篩選方法,其特征在于,包括如下步驟:
步驟一:整理數據庫中某一類癌癥患者的轉錄組測序數據和臨床預后信息,提取每一個基因在癌癥患者癌細胞中的mRNA表達量和患者的生存死亡信息作為訓練集;所述步驟一中的癌癥患者癌細胞基因的mRNA表達量是TPM值,患者的生存死亡信息包括生存狀態和死亡狀態,生存狀態使用數值1表示,死亡狀態使用數值0表示;
步驟二:構建癌癥預后評估模型,使用訓練集對模型進行訓練,并通過模型進行癌癥預后關鍵靶標的預測;所述步驟二包括如下步驟:
采用基于R語言的機器學習算法LASSO回歸構建預后評估模型,對癌癥患者的生存和死亡進行二分類,根據ROC曲線的AUC值分析,確保模型分類的準確率,模型輸出的基因即為癌癥預后相關的關鍵靶標;
步驟三:從數據庫中下載整理全部中藥所含化合物的三維晶體結構,為后續的分子對接做準備;
步驟四:將所有的中藥成分進行吸收-分布-代謝-排泄ADME和類藥五原則過濾篩選,得到中藥活性成分;
所述步驟三、步驟四包括如下步驟:
從中藥系統藥理學TCMSP數據庫中下載收集中藥來源的小分子活性成分三維結構sdf文件,將其導入分子對接工具Discovery Studio 2.5軟件中,通過吸收-分布-代謝-排泄ADME和類藥五原則過濾篩選,將得到的候選小分子化合物組成中藥小分子活性成分數據庫用于虛擬篩選;
步驟五:將中藥活性成分與關鍵靶標分別進行分子對接,獲得與癌癥生存相關靶標的激動劑和與死亡相關靶標的抑制劑;
所述步驟五包括如下步驟:
從公共蛋白數據庫PDB中下載收集與癌癥生存以及死亡相關關鍵靶標的蛋白三維晶體結構,將其進行一系列預處理之后,分別逐一與所述中藥活性成分進行分子對接,篩選出能夠對生存相關關鍵靶標起激活作用的激動劑和對死亡相關關鍵靶標起抑制作用的抑制劑;
步驟六:分別針對得到的生存相關靶標激動劑、死亡相關靶標抑制劑以及兩者的混合物,從數據庫中逐一富集出對應的候選中藥1組、候選中藥2組和候選中藥3組;
步驟七:將富集得到的三組抗癌中藥進行合并去重,匯總整理后形成具有改善癌癥患者預后潛力的候選抗癌中藥清單。
2.如權利要求1所述的一種基于機器學習和分子對接技術的抗癌中藥篩選方法,其特征在于,所述步驟六、步驟七中的中藥富集方法為針對化學成分在中藥中出現的頻次高低進行統計歸納排序,所用的中藥化學成分相關信息檢索數據庫為中藥系統藥理學TCMSP數據庫,最終篩選出含有生存相關關鍵靶標激動劑、死亡相關關鍵靶標抑制劑以及兩者混合物最多的幾味中藥,并按照頻次高低進行降序排列,選擇排名前三的中藥作為候選抗癌中藥。
3.如權利要求1所述的一種基于機器學習和分子對接技術的抗癌中藥篩選方法,其特征在于,所述步驟一中數據庫為TCGA數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京澤橋醫療科技股份有限公司,未經北京澤橋醫療科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210148367.2/1.html,轉載請聲明來源鉆瓜專利網。





