[發明專利]應用智能支持向量機對多環芳烴性質/毒性的預測方法有效
| 申請號: | 201610176440.1 | 申請日: | 2016-03-25 |
| 公開(公告)號: | CN105868540B | 公開(公告)日: | 2018-04-13 |
| 發明(設計)人: | 周真;楊旭;牛訦琛;陳鑫 | 申請(專利權)人: | 哈爾濱理工大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;G06K9/62 |
| 代理公司: | 哈爾濱市偉晨專利代理事務所(普通合伙)23209 | 代理人: | 張偉 |
| 地址: | 150080 黑龍江省哈*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 應用 智能 支持 向量 芳烴 性質 毒性 預測 方法 | ||
1.應用智能支持向量機對多環芳烴性質/毒性的預測方法,該方法包括下述步驟:
1)通過相關的毒性試驗或者已有的數據庫和文獻,獲取67個多環芳烴的致癌性呈陰性 或陽性數據,15個多環芳烴空氣-正辛醇分配系數K OA;
2)使用ChemDraw化學軟件構建多環芳烴的分子結構,利用量子化學軟件Hyperchem對構造出的分子結構進行結構優化,首先采用分子力學方法,在MM+力場下對所建幾何構型進行初步優化,然后在此基礎上通過半經驗的AMI量子化學方法進行精優化,以獲得能量最低的穩定構型;為在合理的時間內獲得精確的分子模型,優化均在嚴格的Hartree-Fock水平上進行,采用Polak-Ribiere算法,直至梯度達到0.01;
3)再將優化后的分子結構輸入Dragon軟件計算相應的描述符,獲得量子化學參數:分 子最高占據軌道能E HOMO、分子最低空軌道能E LUMO、分子剛性h、分子極性α;以及經驗參數分子量MW、分子體積V、分子長度L、分子寬度B和拓撲參數分子連接性指數Randic,共同作為結構描述符;
4)將所獲取的數據為了便于代入MATLAB軟件中,進行格式轉化,建立致癌性PAHs_svc_ scale.mat文件,包含67個多環芳烴致癌性數據,分為47個訓練集,20個測試集;建立空氣—正辛醇分配系數PAHS_svr_scale.mat文件,包含15個多環芳烴K OA數據,分為11個訓練集,4 個測試集;
5)在多環芳烴實測的實驗致癌性值與其分子結構參數化計算值間運用支持向量機分 類算法進行數學建模,K OA與其分子描述符間運用支持向量機回歸算法進行數學建模;
6)對于所構建的數學模型,為進一步增加其預測的準確性,用網格搜索法、遺傳算法和粒子群算法對支持向量機進行智能優化其參數,然后用最佳的尋優參數再進行模型的建 立;
7)在回歸模型的建立上,主要依據相關系數R和均方誤差MES進行預測性能評價,對于 分類模型的建立,主要依據分類準確率Accuracy進行預測性評價;
8)模型的驗證是利用交叉檢驗最常見的“留一法”Q 2,分別對訓練集和測試集進行內部 檢驗和外部檢驗,檢測所建模的穩定性、預測能力和泛化能力;
9)由檢驗指標最佳的優化方法,確定最佳對多環芳烴性質/毒性的預測模型,用于預測 沒有經過實驗測定的同類型有機毒物的相關性質/毒性。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱理工大學,未經哈爾濱理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610176440.1/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





