[發明專利]酚對發光菌毒性預測及評估的新型非線性高效模型構建方法及應用有效
| 申請號: | 201310007830.2 | 申請日: | 2013-01-09 |
| 公開(公告)號: | CN103077313A | 公開(公告)日: | 2013-05-01 |
| 發明(設計)人: | 周瑋;袁哲明;吳樹波;代志軍;陳淵;韓娜 | 申請(專利權)人: | 湖南農業大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 410128 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發光 毒性 預測 評估 新型 非線性 高效 模型 構建 方法 應用 | ||
技術領域
本發明屬于化學技術領域,涉及一種酚對發光菌毒性預測及評估的新型非線性高效模型的構建方法及應用。
背景技術
隨著經濟的飛速發展,與化學品相關的環境問題日益突出。因此,有關有機污染物的毒性風險評估顯得非常重要.?苯酚是一種最常見的環境污染物,特別是在廢水中。由于在環境中的毒性和持久性,苯酚被視為優先關注的環境污染物.?明亮發光細菌?(Photobacterium?phosphoreum)是一種海水中的發光細菌,?其光強隨有毒物質抑制細菌生長(即細胞密度)而變化,使其成為化學品毒性測量和水質監測的重要指標。
定量構效關系(QSAR)建模是一種用于研究苯酚分子結構與毒性關系的有效方法,它有助于解釋結構特征如何決定毒性。尤其在化學品的毒性評估中,一個好的QSAR模型相對于實驗測試具有更快速、更低成本比的巨大優勢。近日報道了一項研究18個酚類似物與毒性(表現為作用于發光菌的EC50)定量構效關系模型,該模型具有3個特征,分別由軟件ChemDraw?Ultra(版本11.0)、半經驗量子化學方法AM1哈密爾頓和EPI?Suite(版本4.0,US-EPA)計算而來,其獨立預測能力較低(=?0.485)。此外,因為模型在特征選擇和建模方法采用逐步線性回歸(SLR)上有明顯缺陷。由于化學毒性和相關特征之間的關系通常是非線性的,構建線性模型從而顯得不合邏輯。所以目前的酚類似物毒性QSAR研究仍面臨諸多不解。因此,基于高維特征數據、非線性特征篩選和非線性建模的模型一定會為設計新的化學品提供更有用信息。
考慮到特征矩陣的高維性,如果從中非線性選擇最有用的子集特征用于建模變得越來越重要。為選擇更合理的QSAR回歸特征,我們采用兩類基于支持向量回歸(SVR)自行開發的方法:多輪末尾汰選(WDEM)和高維特征快速非線性汰選(HDSN)方法。為構建可靠的QSAR模型,我們采用非線性是SVR方法。SVR是一類基于結構風險最小化原則的機器學習方法,它能克服小樣本問題、過擬合、維數災和局部極小的難題,廣泛應用于非線性建模的QASR研究中。
發明內容
為了解決上述技術問題,本發明提供一種酚對發光菌毒性預測及評估的新型非線性高效模型的構建方法及應用,利用非線性SVR技術對源自現有技術的18個酚類化合物對發光菌的毒性(表示為log?EC50)進行QSAR研究。這項工作的目的是基于低維特征數據和高維特征數據,通過非線性化學計量學工具尋找更合理的特征和更可靠的QSAR模型,并詳細分析與毒性相關的最有價值模型及其最關鍵的分子特征。本發明將為設計對發光菌毒性增強或減弱的酚類似物提供有效的理論參考。
具體技術方案為:?
一種酚對發光菌毒性預測及評估的新型非線性高效模型的構建方法,
1)構建信息全面的數據集:包括因變量[Log?EC50?(expt.)]、高維自變量、低維自變量(log?Kow、μ和q-)、高維自變量通過PCLIENT軟件)計算而來;
2)特征的非線性篩選:高維數據利用HDSN方法篩選特征,將高維數據變成低維數據,低維數據進一步利用WDEM方法篩選特征,最后保留的特征用來建模;
3)非線性模型的構建和評估:基于包含關鍵特征的低維數據集和非線性的SVR方法,構建出20個高預測精度的非線性評估模型,SVR2模型(MSE=0.017;=0.921;特征數目=10)最優,由于SVR缺乏解釋性,我們基于實驗室自主開發的SVR解釋性體系,對最優的SVR2模型進行了一系列分析,結果顯示SVR2模型具有顯著的非線性(F-測驗=?65.963;p?=?5.363E-04),該模型中的10個特征及其效應如下:PJI2?(差異顯著)、MATS3v?(差異顯著)、H1p?(差異顯著)、Mor02v?(差異顯著)、Mor14p?(差異顯著)、Mor02u?(差異顯著)、RDF040v?(差異顯著)、Mor23v?(差異顯著)和MATS1m?(差異)。
本發明所述酚對發光菌毒性預測及評估的新型非線性高效模型在預測未知化合物的毒性中的應用。我們根據實驗化合物的取代基規律虛擬了13個酚類似物。根據前面的介紹進行特征提取和活性預測,演示了整個模型推廣應用的流程。
本發明的有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南農業大學,未經湖南農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310007830.2/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





