[發明專利]藥物預測方法及模型的訓練方法、裝置、電子設備及介質在審
| 申請號: | 202110007460.7 | 申請日: | 2021-01-05 |
| 公開(公告)號: | CN112331261A | 公開(公告)日: | 2021-02-05 |
| 發明(設計)人: | 王凡;何徑舟;方曉敏;薛洋;劉荔行;張肖男;吳華;吳甜;王海峰 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G16B15/30 | 分類號: | G16B15/30 |
| 代理公司: | 北京鴻德海業知識產權代理有限公司 11412 | 代理人: | 田宏賓 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 藥物 預測 方法 模型 訓練 裝置 電子設備 介質 | ||
本公開公開了一種藥物預測方法及模型的訓練方法、裝置、電子設備及介質,涉及機器學習與智能醫療等人工智能技術領域。具體實現方案為:獲取數個訓練靶點的藥物數據集;基于各所述訓練靶點的藥物數據集,對所述藥物預測模型進行訓練。另外,還公開了一種藥物信息預測方法和藥物數據的生成方法。根據本公開的技術,能夠使得訓練的藥物預測模型的準確性更高,能夠有效地提高訓練的藥物預測模型的訓練效果。且基于訓練得到的藥物預測模型,可以預測預設靶點的預測藥物的信息,能夠提供一種有效地、能夠提供良好成藥分子的藥物信息設計方案。而且,能夠有效地提高生成的預測藥物信息的準確性。
技術領域
本公開涉及計算機技術領域,具體涉及機器學習與智能醫療等人工智能技術領域,尤其涉及一種藥物預測方法及模型的訓練方法、裝置、電子設備及介質。
背景技術
人類疾病的靶點通常是疾病發展中具有關鍵作用的蛋白質,亦可以稱為蛋白質靶點。藥物通過和靶點蛋白質的結合來使得對應的蛋白質喪失原有功能,從而實現疾病的抑制作用。
在新藥研發過程中,針對特定的蛋白質靶點(Target),需要快速搜索藥物的化合物空間,找到能夠和蛋白質靶點進行結合的化合物(Compound),進而形成可以用于治療的藥物。傳統方法中,通過有經驗的專家,對蛋白質靶點進行研究和估計,并且嘗試設計可能的化合物,并對化合物與蛋白質靶點的親和度(Binding Affinity)進行估計和篩選。傳統方法依賴于經驗和運氣,對于新藥的發現有較大的不確定性。
發明內容
本公開提供了一種藥物預測方法及模型的訓練方法、裝置、電子設備及介質。
根據本公開的一方面,提供了一種藥物預測模型的訓練方法,其中,所述方法包括:
獲取數個訓練靶點的藥物數據集;
基于各所述訓練靶點的藥物數據集,對所述藥物預測模型進行訓練;所述藥物預測模型包括特征處理模塊、編碼模塊和解碼模塊;其中,
所述特征處理模塊,對于各所述訓練靶點的藥物數據集中的各藥物,將對應的藥物的特征表達、所述藥物與對應的所述訓練靶點的特征表達以及所采用的隨機向量表達拼接,得到綜合特征表達;
所述編碼模塊,對所述藥物數據集中的各所述藥物對應的所述綜合特征表達進行編碼處理,得到編碼后的特征表達;
所述解碼模塊,基于各所述藥物對應的所述編碼后的特征表達進行解碼處理,生成并輸出對應的所述訓練靶點的預測藥物的信息。
根據本公開的另一方面,提供了一種藥物信息預測方法,其中,所述方法包括:
獲取預設靶點的藥物數據集;
基于所述預設靶點的藥物數據集,采用預先訓練的藥物預測模型,預測所述預設靶點的預測藥物的信息;所述藥物預測模型包括特征處理模塊、編碼模塊和解碼模塊;其中,
所述特征處理模塊,對于所述預設靶點的藥物數據集中的各藥物,將所述藥物數據集中各藥物的特征表達、所述預設靶點的特征表達以及所采用的隨機向量表達拼接,得到綜合特征表達;
所述編碼模塊,對所述藥物數據集中的各所述藥物對應的所述綜合特征表達進行編碼處理,得到編碼后的特征表達;
所述解碼模塊,基于各所述藥物對應的所述編碼后的特征表達進行解碼處理,生成并輸出對應的所述預設靶點的所述預測藥物的信息。
根據本公開的再一方面,還提供了一種藥物數據的生成方法,其中,所述方法包括:
基于預設靶點對應的藥物數據集,采用預先訓練的藥物預測模型,生成所述預設靶點的預測藥物的信息;
基于所述預測藥物的信息和所述預設靶點,檢測所述預測藥物與所述預設靶點的親和度;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110007460.7/2.html,轉載請聲明來源鉆瓜專利網。





