[發明專利]用于預測化合物活性的兩級擬合QSAR模型的構建方法有效
| 申請號: | 201210455239.9 | 申請日: | 2012-11-14 |
| 公開(公告)號: | CN102930113A | 公開(公告)日: | 2013-02-13 |
| 發明(設計)人: | 劉雅紅;賀利民;梁智斌;方炳虎;陳建新;湯有志;陳良柱 | 申請(專利權)人: | 華南農業大學 |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50;G06N3/02 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 楊曉松 |
| 地址: | 510642 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 預測 化合物 活性 兩級 擬合 qsar 模型 構建 方法 | ||
技術領域
本發明涉及一種OSAR模型的構建方法,尤其是一種用于預測化合物活性的兩級擬合QSAR模型的構建方法,屬于生物醫藥信息技術領域。
背景技術
定量構效關系(Quantitative?Structure-Activity?Relationship,簡稱QSAR)是一種借助數學模型定量預測化合物活性的技術。由于3D?QSAR的研究結果具有明確的指導意義,目前已被許多研究廣泛采用。但由于3D?QSAR的建模過程在商業軟件的黑箱中執行,而軟件黑箱中的過程又難以人為干預,這無疑增大了其建模優化的難度,至今尚未有一種公開發表、公認方便快捷3D?QSAR的建模方法。因此,建立一種方便快捷的3D?QSAR建模方法具有重要意義。
目前,在刊物上記載的3D?QSAR方法在建模過程中,不僅化合物疊合不整齊,而且運用傳統的線性回歸方法(如偏最小二乘法等),在擬合模型的過程中僅考慮有機化學理論、不考慮生物受體的復雜性,導致不符合生物化學理論、影響最終的擬合優度和預測能力。
基于最短距離的Topomer疊合技術具有整齊的疊合結果,是一種具有樂觀應用前景的化合物疊合方法。如果能考慮生物受體的復雜性,使得基于Topomer疊合方法的QSAR研究結果符合生物化學理論,則可提高QSAR模型的擬合優度和預測能力。
神經網絡(Neural?Networks)是一種通過模擬哺乳動物大腦的生理功能進行數據擬合的統計建模方法。神經網絡模型已經成功地應用于生物大分子的功能預測、有機污染物的毒性預測、高分子聚合材料的性能預測等,在化學藥物分子設計中的應用也將日益廣泛。由于神經網絡逼近任意復雜的映射關系,因此當化合物的作用靶標為比小分子更加復雜的生物受體大分子時,基于神經網絡的QSAR模型能比線性模型更準確地預測化合物的生物活性。
基于神經網絡的QSAR建模一般需要通過如下三個步驟:1)整理化合物的活性數據作為因變量;2)挑選合適的描述符作為自變量并計算;3)選用合適的神經網絡方法構建QSAR模型。
其中,挑選合適的描述符作為自變量是建立具有良好預測能力的神經網絡QSAR模型的必要條件。若自變量蘊含的信息增益不足,則所建模型難以具有良好的預測能力,然而增加自變量的數目雖然有可能提高信息增益,但會出現過擬合、不收斂現象而導致模型性能下降、甚至建模失敗。因此,尋找一種包含足夠信息增益的低維向量作為自變量,對于構建基于神經網絡的QSAR模型非常關鍵。
發明內容
本發明的目的,是為了解決上述現有技術的缺陷,提供一種具有良好擬合優度、準確預測化合物生物活性的用于預測化合物活性的兩級擬合QSAR模型的構建方法。
本發明的目的可以通過采取如下技術方案達到:
用于預測化合物活性的兩級擬合QSAR模型的構建方法,其特征在于包括以下步驟:
1)取若干個具有相同骨架的化合物作為訓練集,將訓練集化合物劃分取代基,并疊合訓練集化合物;
2)根據訓練集化合物的結構與活性,采用線性回歸法計算各取代基產生的局部生理作用,建立前級擬合模型;
3)根據訓練集化合物的活性與步驟2)計算得到的局部生理作用,采用神經網絡法計算出化合物的整體生物活性,建立后級擬合模型;
4)將前級擬合模型和后級擬合模型結合,構建成前后兩級QSAR模型。
作為一種優選方案,步驟2)所述訓練集化合物的活性為抑制濃度或抑制率。
作為一種優選方案,步驟1)具體如下:
對于已有的化合物,針對特定檢驗體系進行生物學活性的數據采集,數據指標采用抑制濃度或抑制率的負對數形式[-lg(抑制濃度)或-lg(1/抑制率-1)],以此作為訓練集樣本;使用Sybyl分析軟件檢驗化合物的二維結構,對通過檢驗的化合物生成其三維結構;隨后,進一步劃分化合物的取代基,并進行優化;最后,基于取代基劃分,并采用Topomer疊合技術對以上化合物三維結構進行疊合。
作為一種優選方案,步驟2)具體如下:
用探針掃描疊合的訓練集化合物周圍的分子場,計算MSA、CoMFA或者CoMSIA分子場,對分子場信息進行挑選后,與訓練集化合物的實驗活性進行線性回歸,獲得構效關系的前級擬合模型。
作為一種優選方案,步驟3)具體如下:
將步驟2)計算得到的局部生理作用,與訓練集化合物的活性進行歸一化,得到歸一化值,通過神經網絡模型去歸一化,計算出化合物的整體生物活性,獲得后級擬合模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南農業大學,未經華南農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210455239.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種手動四工位換刀結構
- 下一篇:一種糯小麥烘烤食品及其制作方法





