[發明專利]一種基于深度神經網絡的I型糖尿病風險評估系統在審
| 申請號: | 202110654175.4 | 申請日: | 2021-06-11 |
| 公開(公告)號: | CN113393896A | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 馬玉昆;賈寒;黎松;孫瓊琳;溫顏華;韓仕偉;李偉華 | 申請(專利權)人: | 成都果殼醫學科技有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B20/30;G16B20/50;G16B5/00;G06N3/08;G06N3/04 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 趙悅 |
| 地址: | 610200 四川省成都市成都高新*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 神經網絡 糖尿病 風險 評估 系統 | ||
本發明屬于指紋比對技術領域,涉及一種基于深度神經網絡的I型糖尿病風險評估系統,包括:數據輸入模塊、位點獲取模塊、位點篩選模塊、模型訓練模塊和模型檢驗模塊;數據輸入模塊,用于輸入或采集樣本數據;位點獲取模塊,用于獲取樣本數據的全基因組位點的基因型信息;位點篩選模塊,用于對基因型信息進行GWAS統計,對GWAS統計結果進行質量控制,并根據質量控制后的分析結果對位點進行篩選;模型訓練模塊,用于根據篩選后的位點對神經網絡模型進行訓練,以獲得最優模型;模型檢驗模塊,用于對最優模型進行檢驗。其在不增加任何實驗成本的情況下,盡早地、大規模地實現高遺傳風險患者的篩查,成本低、準確性高、操作簡單方便。
技術領域
本發明涉及一種基于深度神經網絡的I型糖尿病風險評估系統,屬于生物檢測技術領域,特別涉及疾病風險評估技術領域。
背景技術
I型糖尿病是一種自身免疫性疾病,其本質是因免疫系統特異性地攻擊并摧毀自身胰島β細胞,導致患者喪失胰島功能,最終發展為I型糖尿病病人,I型糖尿病的常見風險因素有:家族史、遺傳因素、年齡等。相比較于II型糖尿病患者,I型糖尿病發病年齡更小,受遺傳因素影響更大,因此通過檢測遺傳基因盡早判別個體I型糖尿病的風險是意義重大的。
隨著全基因組關聯分析(GWAS)的發展和深入,越來越多復雜疾病/性狀的遺傳結構得到解析,也系統性地建立起了單核苷酸多態(SNP)與這些復雜性狀之間的關聯,疾病的遺傳度也進一步得到解釋。全基因組基因檢測技術的同步發展和檢測價格持續下降,也為大規模的人群篩查提供了便利條件。在研究日益精細且數據量逐漸增大的趨勢下如何能夠基于遺傳信息進行疾病風險分級,人工智能技術的興起為這種需求的落地提供了可能。
人工智能主要通過輸入高質量的標注后的數據,經過AI系統多層次的訓練,最終輸出分類結果,用于新場景的預測。目前,最為常用的人工智能技術包括深度學習技術(deep learning),其核心算法為卷積神經網絡(Convolutional Neural Networks,CNN)和循環神經網絡(Recurrent Neural Networks,RNN)。但現有技術中將AI系統用于疾病風險預測的方法中,往往存在樣品量小,以致預測結果與實際結果存在較大差異,且傳統的疾病預測方法需要患者已經表現出一定的疾病跡象時,才能夠對其疾病風險進行預測,導致疾病發現較晚,錯過最佳防治時期;此外,還有一些疾病預測方法需要人工對學習的特征進行選定,這就導致學習結果高度依賴于特征選取水平,而且不同的特征選取方法可能會導致不同的結果。
發明內容
針對上述問題,本發明的目的是提供了基于深度神經網絡的I型糖尿病風險評估系統,旨在不增加任何實驗成本的情況下,盡早地、大規模地實現高遺傳風險患者的篩查,成本低、準確性高、操作簡單方便。
為實現上述目的,本發明采取以下技術方案:一種基于深度神經網絡的I型糖尿病風險評估系統,包括:數據輸入模塊、位點獲取模塊、位點篩選模塊、模型訓練模塊和模型檢驗模塊;數據輸入模塊,用于輸入或采集樣本數據;位點獲取模塊,用于獲取樣本數據的全基因組位點的基因型信息;位點篩選模塊,用于對基因型信息進行GWAS統計,對GWAS統計結果進行質量控制,并根據質量控制后的分析結果對位點進行篩選;模型訓練模塊,用于根據篩選后的位點對神經網絡模型進行訓練,以獲得最優模型;模型檢驗模塊,用于對最優模型進行檢驗。
進一步,數據輸入模塊的樣本數據包括患有糖尿病的樣本數據和對照樣本數據,將樣本數據拆分為訓練集和檢驗集,訓練集和檢驗集中均包括患有糖尿病的樣本數據和對照樣本數據,且訓練集和檢驗集不存在樣本數據重疊。
進一步,位點獲取模塊中采用芯片檢測技術獲取全基因組位點的基因型信息,芯片檢測技術中通過多個芯片平臺進行基因型信息的檢測。
進一步,位點篩選模塊中GWAS統計結果至少包括以下內容:染色體號、物理位置、突變位點ID、參考等位、效應等位、效應等位基因頻率、對疾病的效應值、效應值標準差、與疾病關聯的顯著性P值、樣本量大小和種族信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于成都果殼醫學科技有限公司,未經成都果殼醫學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110654175.4/2.html,轉載請聲明來源鉆瓜專利網。





