[發明專利]一種釀酒酵母菌中DNA復制起點的預測方法有效
| 申請號: | 202010636957.0 | 申請日: | 2020-07-03 |
| 公開(公告)號: | CN111755074B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 樊永顯;王婉茹 | 申請(專利權)人: | 桂林電子科技大學 |
| 主分類號: | G16B40/00 | 分類號: | G16B40/00;G16B30/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 桂林市華杰專利商標事務所有限責任公司 45112 | 代理人: | 楊雪梅 |
| 地址: | 541004 廣*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 釀酒 酵母菌 dna 復制 起點 預測 方法 | ||
1.一種釀酒酵母菌中DNA復制起點的預測方法,其特征在于,包括如下步驟:
1)獲取樣本數據集:獲取釀酒酵母菌中的正樣本序列和負樣本序列;
2)特征提取:使用二進制編碼法和PSEKNC-I兩種方法表示樣本序列,即使用一個向量表示每一條NDA序列;
3)特征選擇:使用F-score方法和增量特征選擇方法對步驟2)中使用PSEKNC-I法得到的特征進行篩選,得到預篩選特征;
4)特征組合:將步驟2)中采用二進制編碼法得到特征和步驟3)得到的預篩選特征進行組合,使用二項分布對組合后的特征進一步篩選,獲得特征組合后的樣本數據集;
5)構建模型:構建CNN預測模型,將步驟4)獲得的樣本數據集進行五折交叉驗證實驗,將五折交叉實驗選出的數據集隨機分為5組,其中1組作為測試集,剩余4組作為訓練集,利用訓練集對構建的CNN預測模型進行訓練,得到訓練后的CNN預測模型,將測試集輸入訓練后的預測模型分類器中,得到的分類結果即為預測的復制起點的初步結果;
6)參數調優:根據步驟5)得到的初步結果,調整訓練后的CNN預測模型中的卷積層數、卷積個數、濾波器大小、步長,以及輸出層概率,對訓練后的CNN預測模型進行優化;
7)模型評估:使用五折交叉驗證法對優化后的CNN預測模型進行評估,并使用敏感性、特異性、準確率、馬修斯相關系數四個評估系數對優化后的CNN預測模型的進行衡量,最終得到最優的CNN預測模型,將DNA序列輸入最優的CNN預測模型中,即得到最終的DNA復制起點預測結果;
步驟2)中,所述的二進制編碼法,是利用0、1表示DNA序列中的核苷酸,把每個DNA序列轉化為特征向量,DNA序列中的核苷酸表示方式如下:
公式(1)中,A(0,0,0,0)為DNA序列中的腺嘌呤、C(0,1,0,1)為DNA序列中的胞嘧啶、G(0,0,1,0)為DNA序列中的鳥嘌呤、T(0,0,0,1)為DNA序列中的胸腺嘧啶。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林電子科技大學,未經桂林電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010636957.0/1.html,轉載請聲明來源鉆瓜專利網。





