[發明專利]基于深度森林的有機化學偶聯反應產率預測與分析方法在審
| 申請號: | 202110761921.X | 申請日: | 2021-07-06 |
| 公開(公告)號: | CN113380345A | 公開(公告)日: | 2021-09-10 |
| 發明(設計)人: | 彭李超;楊曉慧;穆雪純;董晶;鄒雪艷;孫磊 | 申請(專利權)人: | 河南大學 |
| 主分類號: | G16C20/70 | 分類號: | G16C20/70;G16C20/10;G06K9/62 |
| 代理公司: | 鄭州立格知識產權代理有限公司 41126 | 代理人: | 崔衛琴 |
| 地址: | 475001 河*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 深度 森林 有機化學 反應 預測 分析 方法 | ||
1.基于深度森林的有機化學偶聯反應產率預測與分析方法,其特征在于:包括以下步驟:1)特征描述符的計算;2)模型的搭建;3)產率的智能回歸和分類預測;
其中,特征描述符的計算,是根據化學軟件計算每種偶聯反應組分的特征描述符,將其轉換為一維數據,以便后續對模型訓練;
模型的搭建,是搭建深度森林模型對特征描述符進行訓練,通過自我調節參數達到最佳預測效果;
產率的智能回歸和分類預測,是使用訓練好的深度森林模型對產率進行智能預測,并對結果進行分析;包括產率預測結果分析和特征描述符的重要性分析。
2.根據權利要求1所述的基于深度森林的有機化學偶聯反應產率預測與分析方法,其特征在于:步驟1)特征描述符的計算具體包括:
(1.1)將化學反應物和試劑導入化學軟件,軟件自動計算每種偶聯反應組分的特征描述符,將化學反應物轉換為一維數據;
(1.2)將一維數據中特征描述符分為訓練集和測試集,并將其分別與對應的產率或產率所屬類別匹配。
3.根據權利要求1所述的基于深度森林的有機化學偶聯反應產率預測與分析方法,其特征在于:步驟2)模型的搭建包括如下步驟:
(2.1)讀取、預處理訓練集,根據需求選擇采用深度森林模型進行回歸預測或是分類預測;
(2.2)采用深度森林算法對偶聯反應的產率進行回歸預測;將訓練集導入級聯層進行特征學習,將每層級聯中的每個隨機森林得到的預測結果和原始特征拼接作為下一層級聯的輸入,不斷如此地訓練,每擴展一層,在驗證集中估計整個級聯的均方誤差,如果沒有顯著的增益或達到設置的最大上限層時,模型停止訓練,從而自動確定級聯級別的數量;將最后一層中所有隨機森林得到的預測值取平均即得到最終的預測值,此時輸出預測結果,通過調節參數選取最好的預測結果并保存模型;
(2.3)采用深度森林算法對偶聯反應的產率所屬類別進行分類預測;將訓練集導入級聯層進行特征學習,將每層級聯中的每個隨機森林得到的類概率向量和原始特征拼接作為下一層級聯的輸入,不斷如此地訓練,每擴展一層,在驗證集中估計整個級聯的預測準確率,如果沒有顯著的增益或達到設置的最大上限層時,模型停止訓練,從而自動確定級聯級別的數量;將最后一層中所有隨機森林輸出的類概率向量取平均值,最大的類概率所屬的類別即為最終的預測類別;此時輸出預測結果,通過調節參數選取最好的預測結果并保存模型;
(2.4)對訓練后的模型進行樣本外預測,如果樣本外預測是有效的,則驗證了模型的有效性;
(2.5)用戶可根據預測效果,結合自身需求,自我進行參數調整,若不滿意,則用戶可以調整深度森林中森林的種類、數量,以及每個森林中包含的決策樹的數量,深度森林的最大深度,并返回步驟(2.3),直至用戶滿意。
4.根據權利要求1所述的有機化學偶聯反應產率預測與分析方法,其特征在于:步驟3)產率的智能回歸和分類預測,具體包括:
(3.1)產率的智能回歸預測,將訓練集和對應的產率導入級聯層進行特征學習,當模型停止訓練時,將最后一層級聯中的每個隨機森林得到預測值取平均值,即為最終預測結果;
(3.2)產率的智能分類預測,將訓練集和對應的產率所屬類別導入級聯層進行特征學習,當模型停止訓練時,將最后一層中所有隨機森林輸出的類概率向量取平均值,最大的類概率所屬的類別即為最終的預測類別;
(3.3)通過深度森林算法計算特征描述符的重要性排序;以此找到對反應產率影響較為顯著的描述符,為用戶進行有機化學偶聯反應提供可靠的決策信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于河南大學,未經河南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110761921.X/1.html,轉載請聲明來源鉆瓜專利網。





