[發明專利]采用邏輯回歸方法預測有機化學品生物降解性有效
| 申請號: | 201310234499.8 | 申請日: | 2013-06-11 |
| 公開(公告)號: | CN103345544A | 公開(公告)日: | 2013-10-09 |
| 發明(設計)人: | 李雪花;陳廣超;陳景文;喬顯亮 | 申請(專利權)人: | 大連理工大學 |
| 主分類號: | G06F17/50 | 分類號: | G06F17/50 |
| 代理公司: | 大連理工大學專利中心 21200 | 代理人: | 梅洪玉 |
| 地址: | 116024*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 采用 邏輯 回歸 方法 預測 有機 化學品 生物降解 | ||
技術領域
本發明涉及一種采用邏輯回歸算法預測有機化學品生物降解性,屬于生態風險評價測試策略領域。
背景技術
環境中微生物可以通過氧化、還原及水解等作用破壞某些有機物的分子結構或使其礦化,將有機物從環境中去除。此過程即為生物降解,其是污染物從環境中去除的重要途徑,影響著污染物的環境持久性和環境歸趨。我國于2003年9月就頒布了《新化學物質環境管理辦法》,并于2010年10月進行了修訂,要求對新化學品的環境持久性等性質進行鑒別,再根據所得結果進行批準和必要時的限制。生物降解性是評估化合物環境持久性的重要參數,因此獲取生物降解性數據對化學品的風險評價和管理具有重要意義。
實驗測定是目前獲取化合物生物降解性數據的主要途徑,我國于2008年就參考經濟合作與發展組織(OECD)的化學品生物降解測試導則,制定了包括CO2產生試驗等六種測定化合物快速生物降解性的試驗導則。但是由于現有化學品數量已超過14萬種,根據歐盟REACH法規估算檢測每一種化學品的基本費用約為8.5萬歐元,因此若僅通過實驗測定來獲取數據,不僅費用昂貴,而且測試實驗周期長(需28天),不能滿足有機化學品風險評價和管理工作的數據需要。因此通過定量構效關系(QSAR)方法發展一種能快速高效獲取有機化學品生物降解性的模型具有重要的應用意義。
QSAR方法的理論基礎是化合物分子結構差異決定著其理化性質或活性效應的不同,因此僅通過化合物分子結構就能預測其理化性質、環境行為或毒理學參數(統稱為活性)。作為一種可信的技術工具QSAR方法已成功應用于污染物環境行為參數(如生物富集系數、亨利定律常數和水解速率常數)和毒理學指標(如雌激素干擾效應)的預測。歐盟《關于化學品注冊、評估、許可和限制制度》也明確規定QSAR方法可以為化學品的注冊提供信息支持。2004年OECD提出的QSAR模型構建和使用準則規定,具有如下5個標準的QSAR模型可以應用于化學品的風險評價與管理:(1)具有明確定義的環境指標;(2)具有明確的算法;(3)定義了模型的應用域;(4)模型具有適當的擬合度、穩定性和預測能力;(5)最好能夠進行機理解釋。
目前,已有許多研究者應用(Q)SAR方法建立了有機化合物生物降解性的預測模型。如文獻“Environ.Sci.Technol.,1994,28,459-465”采用36種分子結構描述符建立了295種化合物的生物降解性預測模型,所得線性和邏輯回歸模型預測準確率分別為89.5%和93.2%;文獻“Environ.Toxicol.Chem.,2000,19,2478-2485”選取36種分子結構碎片及相對分子質量建立了589種化合物的線性和邏輯回歸模型,其對驗證集(295種)的預測準確率分別為81.4%和80.7%。以上模型雖然具有良好的預測性能,對訓練集(和驗證集)的準確率良好,但是模型涵蓋化合物數較少,因此應用范圍有限。文獻“J.Chem.Inf.Model.,2012,52,655-669”采用拓撲、結構和量子化學描述符,基于支持向量機(SVM)、k最近鄰(kNN)和樸素貝葉斯三種算法建立了1631種化合物的預測模型,三種模型對訓練集預測準確率分別為83.8%,78.6%和78.6%,預測集準確率分別為96.3%,74.1%和85.2%;文獻“J.Chem.Inf.Model.,53,867-878”分別采用14和12種分子結構描述符,基于SVM和kNN方法建立了1725種化合物的預測模型,所建模型在訓練集、驗證集和預測集上的準確率均大于82.0%,具有良好的預測性能。上述兩研究通過SVM和kNN方法構建的模型都涵蓋較多化合物,應用域廣并且預測性能良好。但是SVM模型的預測規則只蘊藏在由少量支持向量樣本“加權”得到的決策函數中,無從知道模型如何對化合物進行分類和預測。kNN更是一種惰性學習算法,需要直接使用訓練集數據進行預測,直至給定一個測試數據時才開始構造泛化模型。因此兩種模型都具有“黑箱”性質,無法提取預測規則、可理解性差,不利于模型應用和機理解釋。因此,有必要建立一個涵蓋多種類化合物,并且模型結構簡單、預測規則透明、易于理解和實際應用的QSAR模型,同時按照OECD導則對模型進行應用域表征和機理解釋。
發明內容
本發明目的是發展一種簡潔、快捷、高效預測有機化學品生物降解性的方法。該方法可以直接根據化合物分子結構預測其生物降解性,進而對目標化合物的環境持久性進行預測和評價,為化學品風險評價和管理提供必要的基礎數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連理工大學,未經大連理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310234499.8/2.html,轉載請聲明來源鉆瓜專利網。





