[發明專利]甲基化測序數據的處理方法和裝置有效
| 申請號: | 202110232548.9 | 申請日: | 2021-03-02 |
| 公開(公告)號: | CN112599194B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 樓峰;周濤;張萌萌;郭璟;曹善柏 | 申請(專利權)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫醫學科技有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 路秀麗 |
| 地址: | 100080 北京市通州區經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 甲基化 序數 處理 方法 裝置 | ||
1.一種甲基化測序數據的處理方法,其特征在于,所述處理方法包括:
通過變分自動編碼的方法建立甲基化測序數據的預測模型,所述甲基化測序數據為與不同癌種相關的甲基化測序數據,所述預測模型為不同癌種的預測模型;
將待測樣本的甲基化測序數據輸入所述預測模型;
輸出預測結果,通過變分自動編碼的方法建立甲基化測序數據的預測模型包括:
采用變分自動編碼器將已知數據庫中的甲基化測序數據轉換為擬真數據;
利用所述擬真數據進行模型預訓練,得到預訓練模型;
在所述模型預訓練過程中對所述預訓練模型的超參數進行自動選擇,篩選出最優模型,作為所述預測模型;在所述模型預訓練過程中還包括采用微調編碼器對預訓練模型的結構進行調整,選擇性載入所述預訓練模型的權重后,再對所述預訓練模型重新進行所述模型預訓練,
在采用所述微調編碼器對所述預訓練模型進行結構調整,選擇性載入所述預訓練模型的權重之后,所述處理方法還包括對超參數進行自動選擇,從而篩選出最優模型作為所述預測模型。
2.根據權利要求1所述的處理方法,其特征在于,所述已知數據庫為TCGA數據庫,通過變分自動編碼的方法建立甲基化測序數據的預測模型包括:
從所述TCGA數據庫中選擇目的表型的甲基化測序數據,并拆分為訓練集和驗證集;
利用所述變分自動編碼器將所述訓練集和所述驗證集中的所述甲基化測序數據轉換為擬真數據集;
并利用所述訓練集的所述擬真數據集進行模型預訓練,優選所述預訓練過程中采用超參數自動選擇,得到預訓練模型;
利用所述驗證集的所述擬真數據對所述預訓練模型進行驗證,并采用微調編碼器對所述預訓練模型進行調整,所述調整包括對所述預訓練模型執行自動超參數掃描,自動調整模型的超參數選擇,從而選擇最優模型作為所述預測模型。
3.一種甲基化測序數據的處理裝置,其特征在于,所述處理裝置包括:
模型建立模塊,用于通過變分自動編碼的裝置建立甲基化測序數據的預測模型,所述甲基化測序數據為與不同癌種相關的甲基化測序數據,所述預測模型為不同癌種的預測模型;
數據輸入模塊,用于將待測樣本的甲基化測序數據輸入所述預測模型;
結果輸出模塊,用于輸出預測結果,所述模型建立模塊包括:
數據轉換模塊,所述數據轉換模塊為變分自動編碼器,用于將已知數據庫中的甲基化測序數據轉換為擬真數據;
訓練模塊,用于利用所述擬真數據進行模型預訓練,得到預訓練模型;
調整模塊,所述調整模塊包括自動超參數掃描模塊,用于在所述模型預訓練過程中對所述預訓練模型的超參數進行自動選擇,篩選出最優模型,作為所述預測模型,所述調整模塊還包括微調編碼器,用于對所述預訓練模型進行調整后,對所述預訓練模型重新進行所述模型預訓練。
4.根據權利要求3所述的處理裝置,其特征在于,所述已知數據庫為TCGA數據庫,所述模型建立模塊包括:
數據選擇模塊,用于從所述TCGA數據庫中選擇目的表型的甲基化測序數據,并拆分為訓練集和驗證集;
所述數據轉換模塊,用于利用所述變分自動編碼器將所述訓練集和所述驗證集中的所述甲基化測序數據轉換為擬真數據集;
所述訓練模塊,用于利用所述訓練集的所述擬真數據集進行模型預訓練,得到預訓練模型;
調整模塊,用于利用所述驗證集的所述擬真數據對所述預訓練模型進行驗證,并采用微調編碼器對所述預訓練模型進行調整,所述調整包括對所述預訓練模型執行自動超參數掃描,自動調整模型的超參數選擇,選擇最優模型作為所述預測模型。
5.一種存儲介質,其特征在于,所述存儲介質包括存儲的程序,其中,在所述程序運行時控制所述存儲介質所在設備執行權利要求1或2所述的甲基化測序數據的處理方法。
6.一種處理器,其特征在于,所述處理器用于運行程序,其中,所述程序運行時執行權利要求1或2所述的甲基化測序數據的處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫醫學科技有限公司,未經北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫醫學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110232548.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:雙核鎖步錯誤恢復系統及方法
- 下一篇:一種應用于3D打印機的油墨進料裝置





