[發明專利]一種生物學回歸預測方法、裝置、設備及存儲介質在審
| 申請號: | 202211190198.5 | 申請日: | 2022-09-28 |
| 公開(公告)號: | CN115565611A | 公開(公告)日: | 2023-01-03 |
| 發明(設計)人: | 劉華清;韓藍青 | 申請(專利權)人: | 廣州譯碼基因科技有限公司 |
| 主分類號: | G16B40/20 | 分類號: | G16B40/20;G16B30/00;G16B20/00;G16B20/50;G06N20/00;G06N3/08 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 黎揚鵬 |
| 地址: | 510663 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 生物學 回歸 預測 方法 裝置 設備 存儲 介質 | ||
1.一種生物學回歸預測方法,其特征在于,所述方法包括:
獲取目標對象的第一生物學序列數據;
將所述第一生物學序列數據輸入到第一回歸預測網絡或者第二回歸預測網絡中的至少一者,得到第一分數預測值;所述第一分數預測值用于表征預測得到的所述目標對象在預設的生物學維度的指標值;
其中,所述第一回歸預測網絡和所述第二回歸預測網絡通過以下步驟訓練得到:
獲取生物學實驗數據集,所述生物學實驗數據集中包括多個訓練樣本;每個所述訓練樣本包括樣本對象的第二生物學序列數據和分數實驗值,所述分數實驗值用于表征實驗得到的所述樣本對象在預設的生物學維度的指標值;
將所述訓練樣本輸入到初始化的第一回歸預測網絡和第二回歸預測網絡進行熱身訓練,得到基礎的第一回歸預測網絡和基礎的第二回歸預測網絡;
將所述訓練樣本輸入到所述基礎的第一回歸預測網絡和基礎的第二回歸預測網絡進行帶噪協同訓練,得到訓練好的第一回歸預測網絡和訓練好的第二回歸預測網絡。
2.根據權利要求1所述的一種生物學回歸預測方法,其特征在于,所述第一生物學序列數據包括堿基序列數據或者氨基酸序列數據。
3.根據權利要求1所述的一種生物學回歸預測方法,其特征在于,將所述訓練樣本輸入到初始化的第一回歸預測網絡進行熱身訓練,得到基礎的第一回歸預測網絡,包括:
將所述第二生物學序列數據輸入到初始化的第一回歸預測網絡,得到所述初始化的第一回歸預測網絡輸出的第二分數預測值;所述第二分數預測值用于表征預測得到的所述樣本對象在預設的生物學維度的指標值;
根據所述第二分數預測值和所述分數實驗值,計算得到第一損失值;
根據所述第一損失值對所述第一回歸預測網絡的參數進行更新,并迭代訓練直至迭代輪次達到預設輪次。
4.根據權利要求1所述的一種生物學回歸預測方法,其特征在于,所述將所述訓練樣本輸入到所述基礎的第一回歸預測網絡和基礎的第二回歸預測網絡進行帶噪協同訓練,得到訓練好的第一回歸預測網絡和第二回歸預測網絡,包括:
將所述訓練樣本輸入到所述基礎的第一回歸預測網絡和所述基礎的第二回歸預測網絡,計算所述第一回歸預測網絡和所述第二回歸預測網絡輸出結果的預測差值;
根據所述預測差值的大小對所述訓練樣本分類,得到低噪聲樣本數據集和高噪聲樣本數據集;
根據所述低噪聲樣本數據集和所述高噪聲樣本數據集,對所述基礎的第一回歸預測網絡和所述基礎的第二回歸預測網絡進行訓練,得到訓練好的第一回歸預測網絡和訓練好的第二回歸預測網絡。
5.根據權利要求4所述的一種生物學回歸預測方法,其特征在于,所述將所述訓練樣本輸入到所述基礎的第一回歸預測網絡和所述基礎的第二回歸預測網絡,計算所述第一回歸預測網絡和所述第二回歸預測網絡輸出結果的預測差值,包括:
將所述第二生物學序列數據輸入到基礎的第一回歸預測網絡,得到所述基礎的第一回歸預測網絡輸出的第三分數預測值;所述第三分數預測值用于表征預測得到的所述樣本對象在預設的生物學維度的指標值;
將所述第二生物學序列數據輸入到基礎的第二回歸預測網絡,得到所述基礎的第二回歸預測網絡輸出的第四分數預測值;所述第四分數預測值用于表征預測得到的所述樣本對象在預設的生物學維度的指標值;
計算所述第三分數預測值和所述第四分數預測值之間差值的絕對值,得到所述預測差值。
6.根據權利要求4所述的一種生物學回歸預測方法,其特征在于,所述根據所述預測差值的大小對所述訓練樣本分類,得到低噪聲樣本數據集和高噪聲樣本數據集,包括:
基于所述預測差值,采用高斯混合模型對所述訓練樣本進行分類預測,得到各個所述訓練樣本屬于高噪聲樣本數據集的預測概率;
當所述訓練樣本對應的預測概率大于概率閾值,將所述訓練樣本劃分到所述高噪聲樣本數據集;或者,當所述訓練樣本對應的預測概率小于或者等于所述概率閾值,將所述訓練樣本劃分到所述低噪聲樣本數據集。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州譯碼基因科技有限公司,未經廣州譯碼基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211190198.5/1.html,轉載請聲明來源鉆瓜專利網。





