[發明專利]定量構效關系輔助匹配分子對分析方法在審
| 申請號: | 202010098622.8 | 申請日: | 2020-02-18 |
| 公開(公告)號: | CN111341390A | 公開(公告)日: | 2020-06-26 |
| 發明(設計)人: | 曹東升;付麗;楊梓宜 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G16C20/50 | 分類號: | G16C20/50;G16C20/70 |
| 代理公司: | 長沙軒榮專利代理有限公司 43235 | 代理人: | 李喆 |
| 地址: | 410000 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 定量 關系 輔助 匹配 分子 分析 方法 | ||
本發明提供了一種定量構效關系輔助匹配分子對分析方法,包括:對分子的結構進行清洗、除鹽、去復合物,收集實驗數據,并對所述實驗數據進行預處理;計算分子描述符,根據所述分子描述符建立定量構效關系模型;根據所述定量構效關系模型預測現有的數據庫,擴增實驗數據;選出預測準確的分子,將標準偏差作為到定量構效關系模型的距離,從而評估模型的定量構效關系應用域;將挑選出來預測準確的數據和收集的實驗數據混合進行匹配分子對分子。本發明解決了匹配分子對分析在小數據上應用得到限制的問題,挖掘出了一些還未被探索的新的化學規則,有更多的知識指導先導化合物的優化,加速了藥物設計周期。
技術領域
本發明涉及計算機輔助藥物設計的技術領域,特別涉及一種定量構效關系輔助匹配分子對分析方法。
背景技術
先導化合物的優化是一項復雜、耗時的任務,優化的目的是為了找到更理想的理化性質,良好的藥代動力學性質,提高化合物的生物利用度,降低毒性等等,使其值得讓一個分子進入到藥物發現的候選階段。如果藥物化學家能夠設想一個合適的取代基來修飾核心骨架來解決以上的所有問題,那么一種新的潛在的價值數十億美元的產品就可能被發明并獲得專利。而藥物化學家們的靈感主要取決于已知的藥物、文獻知識、過去的合成經驗或者是其他項目的同事。在這個過程中,總結經驗知識,掌握這些化學結構的變化規律對制藥企業和藥物設計者合理的改造先導化合物,提高藥物優化是至關重要的。
匹配分子對對分析(matched molecular pair analysis,MMPA)作為一個從大量實驗數據中,提出藥物化學知識并指導先導化合物的改造的工具脫穎而出。一個匹配分子對(Matched molecular pair,MMP)定義為一對化合物,它們只有一個位點發生結構改變。形成匹配分子對的化合物通過兩個子結構的交換而相互轉化,這稱為化學轉換。對于由同一轉換連接的所有對,我們通過匹配分子對分析計算屬性差異并匯總統計信息,從而獲得使用化學語言描述的規則指導先導化合物的優化。但是,進行匹配分析對分析的數據缺少的問題,研究者們并沒有關注。目前大多數關于匹配分子對分析的出版物都是來自于擁有龐大實驗室數據的制藥公司。雖然有來自學術團隊的匹配分析對分析的出版物存在,但是相對較少,最可能的原因就是在這個以專利為基礎的競爭環境下,藥物公司只公開內部產生的所有信息中的部分數據。對于小數據集,它們缺少分子對,缺乏特定的化學轉化的知識,從而不足以執行匹配分子對分析。導致有許多有價值的化學規則還未被挖掘或者開發。因此,基于以上分析,數據的缺乏成為了限制MMPA應用的一個關鍵問題。
發明內容
本發明提供了一種定量構效關系輔助匹配分子對分析方法,其目的是為了解決匹配分子對分析在小數據上應用得到限制的問題。
為了達到上述目的,本發明的實施例提供了一種定量構效關系輔助匹配分子對分析方法,包括:
步驟1,對分子的結構進行清洗、除鹽、去復合物,收集實驗數據,并對所述實驗數據進行預處理;
步驟2,計算分子2D描述符,根據所述分子2D描述符建立定量構效關系模型;
步驟3,根據所述定量構效關系模型預測現有的數據庫,擴增實驗數據;
步驟4,選出預測準確的分子,將標準偏差作為到定量構效關系模型的距離,從而評估模型的應用域;
步驟5,將挑選出來預測準確的數據和收集的實驗數據混合進行匹配分子對分子。
其中,所述步驟1還包括:
對分子結構進行標準化處理,如一個分子對應多個目標值,則取中位數。
其中,所述步驟2具體包括:
使用極度梯度提升樹、支持向量機、隨機森林、Cubist、相關向量機、梯度提升樹、深度學習、高斯建立分類或回歸預測模型;
對上述方法進行排列組合,通過求算數平均值建立共識模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010098622.8/2.html,轉載請聲明來源鉆瓜專利網。





