[發明專利]一種基于極端梯度提升算法的新型冠狀病毒分類方法在審
| 申請號: | 202110039827.3 | 申請日: | 2021-01-13 |
| 公開(公告)號: | CN112766352A | 公開(公告)日: | 2021-05-07 |
| 發明(設計)人: | 馬寶山;柴冰潔;陳玉珍;張樹正;吳一銘;羅璐瑤 | 申請(專利權)人: | 大連海事大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G16H50/80 |
| 代理公司: | 大連至誠專利代理事務所(特殊普通合伙) 21242 | 代理人: | 張海燕;楊威 |
| 地址: | 116000 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 極端 梯度 提升 算法 新型 冠狀病毒 分類 方法 | ||
本發明提供一種基于極端梯度提升算法的新型冠狀病毒分類方法,用于解決現有技術中存在的分類精度較低的技術問題,實現步驟為:獲取三種現存病毒數據集和新型冠狀病毒數據集,預處理三種病毒數據集和新型冠狀病毒數據集,三種病毒數據集作為訓練集,新型冠狀病毒數據集作為獨立測試集,使用訓練集訓練并優化XGBoost模型,獲取最優模型后對測試集分類,得到模型評估指標以及測試集的預測標簽。本發明有效提高了新型冠狀病毒分類的準確性。
技術領域
本發明涉及新型冠狀病毒分類技術領域,尤其涉及一種基于極端梯度提升算法的新型冠狀病毒分類方法。
背景技術
經研究發現,新型冠狀病毒與現有的冠狀病毒科之間存在一定的聯系。對于一種新出現的病毒,我們要研究它與現有的病毒基因組之間最相關的關系,這就需要將病毒劃分類別,從而判斷該病毒是否由某些病毒重組產生的,或是作為一個新的感染人類的譜系獨立產生的。然而大多技術存在分類精度低,運算速度慢,硬件需求高等缺點。
發明內容
本發明提出一種基于極端梯度提升算法的新型冠狀病毒分類方法,其特征在于,包括如下步驟:
(1)獲取三種現存病毒數據集和新型冠狀病毒數據集;
(1a)從美國國家生物技術信息中心、全球共享流感數據倡議組織、Virus-Host DB三個平臺獲取所需的病毒數據,包括甲型冠狀病毒屬,乙型冠狀病毒屬,丁型冠狀病毒屬,COVID-19序列;
(1b)排除所有小于2000堿基對和大于50000堿基對的DNA序列,以解決序列長度偏差可能引起的問題;
(2)預處理三種病毒數據集和新型冠狀病毒數據集,之后將三種病毒數據集作為訓練集,新型冠狀病毒數據集作為獨立測試集;
(2a)將DNA序列映射成離散數字序列;
(2b)采用零填充方法將DNA序列對應的離散數字序列長度歸一化到25000,其中長度小于25000的序列通過零填充擴展到25000,而長度大于25000的序列將其超過25000的部分刪除;
(2c)將所述離散數字序列進行離散傅里葉變換(DFT變換),取模后得到幅度譜,該幅度譜也是DNA序列的幅度譜;
(2d)計算出所有序列的幅度譜后,將甲型冠狀病毒屬,乙型冠狀病毒屬,丁型冠狀病毒屬的所有序列的幅度譜整合到一個數據集中,該數據集作為訓練集數據,COVID-19序列的幅度譜整合到一個數據集中,該數據集作為獨立測試集數據;
(3)使用訓練集訓練并優化XGBoost模型,并獲取最優模型;
(3a)將訓練集數據劃分為五份,其中一份作為驗證集,其余四份作為訓練集;
(3b)結合網格搜索方法和內部三折交叉驗證對模型的參數進行調整,將訓練集劃分成三份,其中一份作為內部測試集,另外兩份作為內部訓練集,在不同的參數組合下使用內部訓練集訓練XGBoost模型,使用內部測試集對模型的分類性能進行評估,該步驟重復三次,得到三次評價指標中最高分數對應的參數,作為模型的最佳超參數;
(3c)在訓練集上使用最佳超參數訓練模型,使用訓練好后的模型對驗證集預測,得到模型對驗證集的評估指標;
(3d)重復步驟3a至3c五次以實現五折交叉驗證,將在五個驗證集中得到的評價指標取平均值作為模型最終的分類性能指標;
(3e)選出五次訓練出的模型中的最優模型,用以對獨立測試集分類;
(4)使用最優模型結合模型的特征選擇功能對測試集分類,得到模型評估指標和測試集的預測標簽;
(4a)利用在訓練集上訓練好的最優模型進行特征重要性排序,得分高的前L個特征為選取的特征子集;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大連海事大學,未經大連海事大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110039827.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種移動除塵管道接口的密封裝置
- 下一篇:一種具有輔助更換機構的閥門





