[發明專利]病毒基因分類的方法、裝置及電子設備在審
| 申請號: | 202110735404.5 | 申請日: | 2021-06-30 |
| 公開(公告)號: | CN113299345A | 公開(公告)日: | 2021-08-24 |
| 發明(設計)人: | 王升啟;周喆;李非;楊騫;張孝昌 | 申請(專利權)人: | 中國人民解放軍軍事科學院軍事醫學研究院 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B40/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 榮穎佳 |
| 地址: | 100082 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 病毒 基因 分類 方法 裝置 電子設備 | ||
1.一種病毒基因分類的方法,其特征在于,所述方法包括:
獲取表征待分類病毒基因的基因序列特征數據集;
計算所述基因序列特征數據集與指定病毒基因對應的特定基因序列特征數據集的相似距;
根據所述相似距對所述待分類病毒基因進行分類。
2.根據權利要求1所述方法,其特征在于,計算所述基因序列特征數據集與指定病毒基因對應的特定基因序列特征數據集的相似距的步驟,包括:
將所述基因序列特征數據集輸入至預先訓練好的度量分類模型,通過所述度量分類模型計算所述基因序列特征數據集與指定基因對應的特定基因序列特征數據集的相似距;
其中,所述度量分類模型為通過所述指定病毒基因對應的特定基因序列特征數據集對神經網絡訓練得到的分類模型;所述特定基因序列特征數據集為對所述指定病毒基因對應的基因序列特征數據集進行相似距標記的數據。
3.根據權利要求2所述方法,其特征在于,所述方法還包括:
對所述特定基因序列特征數據集進行預處理,得到訓練數據集;
將所述訓練數據集輸入至神經網絡進行訓練,直到訓練周期的次數達到預設值或者網絡損失值達到預設網絡損失閾值為止,得到度量分類模型。
4.根據權利要求3所述方法,其特征在于,在對所述特定基因序列特征數據集進行預處理之前,所述方法還包括:
基于k-mer基因序列劃分方法對所述基因序列特征數據集進行等長基因序列劃分;
對劃分后的所述基因序列特征數據集進行相似距標記,得到所述特定基因序列特征數據集。
5.根據權利要求3所述方法,其特征在于,所述神經網絡為包含4個隱含層的孿生卷積神經網絡。
6.根據權利要求3所述方法,其特征在于,訓練所述網絡損失值對應的網絡損失函數為交叉熵損失函數。
7.一種基因分類的裝置,其特征在于,所述裝置包括:
獲取模塊,用于獲取表征待分類病毒基因的基因序列特征數據集;
計算模塊,用于計算所述基因序列特征數據集與指定病毒基因對應的特定基因序列特征數據集的相似距;
分類模塊,用于根據所述相似距對所述待分類病毒基因進行分類。
8.根據權利要求7所述裝置,其特征在于,所述計算模塊還用于:
將所述基因序列特征數據集輸入至預先訓練好的度量分類模型,通過所述度量分類模型計算所述基因序列特征數據集與指定基因對應的特定基因序列特征數據集的相似距;
其中,所述度量分類模型為通過所述指定基因對應的特定基因序列特征數據集對神經網絡訓練得到的分類模型;所述特定基因序列特征數據集為對所述指定病毒基因對應的基因序列特征數據集進行相似距標記的數據。
9.一種電子設備,其特征在于,包括處理器和存儲器,所述存儲器存儲有能夠被所述處理器執行的計算機可執行指令,所述處理器執行所述計算機可執行指令以實現權利要求1至5任一項所述方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機可執行指令,所述計算機可執行指令在被處理器調用和執行時,計算機可執行指令促使處理器實現權利要求1至5任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍軍事科學院軍事醫學研究院,未經中國人民解放軍軍事科學院軍事醫學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110735404.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種液壓驅動限位式蓄電池擺放托盤配合裝置
- 下一篇:一種自由轉動電驅動萬向輪





