[發明專利]基因數據處理方法、裝置、計算機設備及存儲介質在審
| 申請號: | 202110049631.2 | 申請日: | 2021-01-14 |
| 公開(公告)號: | CN114765062A | 公開(公告)日: | 2022-07-19 |
| 發明(設計)人: | 冀顏 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 祝亞男 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因 數據處理 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種基因數據處理方法,其特征在于,所述方法包括:
基于待測基因的基因功能查詢請求,確定所述待測基因所對應的細胞類型;
獲取所述細胞類型對應的單細胞表達數據集以及所述細胞類型所對應的基因關聯模型,所述基因關聯模型用于獲取所述待測基因與所述單細胞表達數據集中屬于所述細胞類型的候選基因之間的非線性關聯程度;
調用所述基因關聯模型對所述待測基因進行處理,得到所述待測基因分別與所述單細胞表達數據集中屬于所述細胞類型的多個候選基因之間的非線性關聯程度;
輸出非線性關聯程度符合第一目標條件的候選基因的功能注釋信息,所述第一目標條件用于表示所述非線性關聯程度大于或等于關聯程度閾值。
2.根據權利要求1所述的方法,其特征在于,所述調用所述基因關聯模型對所述待測基因進行處理,得到所述待測基因分別與所述單細胞表達數據集中屬于所述細胞類型的多個候選基因之間的非線性關聯程度包括:
基于所述待測基因和所述多個候選基因,構建多個基因對,所述多個基因對中的任一基因對包括所述待測基因和所述多個候選基因中的任一候選基因;
將所述多個基因對輸入所述基因關聯模型,通過所述基因關聯模型對所述多個基因對進行卷積處理,得到多個關聯系數,所述多個關聯系數中的任一關聯系數用于表示所述多個基因對中的任一基因對所包含的基因之間的非線性關聯程度。
3.根據權利要求1所述的方法,其特征在于,所述基因關聯模型的訓練過程包括:
從所述單細胞表達數據集中,獲取多個樣本基因,所述多個樣本基因的變異程度大于變異閾值;
基于所述多個樣本基因,獲取多個陽性基因對和多個陰性基因對,其中,任一陽性基因對所包含的基因之間的非線性關聯程度大于所述關聯程度閾值,任一陰性基因對所包含的基因之間的非線性關聯程度小于所述關聯程度閾值;
基于所述多個陽性基因對和所述多個陰性基因對,調整初始深度模型的參數,得到所述基因關聯模型。
4.根據權利要求3所述的方法,其特征在于,所述基于所述多個樣本基因,獲取多個陽性基因對和多個陰性基因對包括:
從所述多個樣本基因中,將屬于同一蛋白質復合體的兩個樣本基因確定為一個陽性基因對;
將所述陽性基因對中的任一樣本基因與所述多個樣本基因中除了所述陽性基因對之外的任一樣本基因確定為一個陰性基因對。
5.根據權利要求3所述的方法,其特征在于,所述基于所述多個陽性基因對和所述多個陰性基因對,調整初始深度模型的參數,得到所述基因關聯模型包括:
對于所述多個陽性基因對和所述多個陰性基因對中的任一基因對,調用所述初始深度模型預測所述任一基因對的關聯系數;
基于所述多個陽性基因對和所述多個陰性基因對的關聯系數,確定所述初始深度模型的損失函數值;
響應于所述損失函數值不符合停止條件,迭代訓練所述初始深度模型,直到損失函數值符合所述停止條件時,停止訓練,得到所述基因關聯模型。
6.根據權利要求3所述的方法,其特征在于,所述方法還包括:
對于所述多個陽性基因對和所述多個陰性基因對中的任一基因對,獲取多個基因關聯模型對所述任一基因對預測得到的多個關聯系數,所述多個基因關聯模型分別對應于至少一個單細胞表達數據集中的多個細胞類型;
基于所述任一基因對的所述多個關聯系數,確定所述任一基因對是否符合第二目標條件,所述第二目標條件用于表示所述多個基因關聯模型對所述任一基因對的預測難度低于第一目標閾值;
基于符合所述第二目標條件的基因對,調整與所述細胞類型所對應的所述基因關聯模型的參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110049631.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種骨傳導揚聲器
- 下一篇:產生假光信號的裝置、方法以及可重構光分插復用器





