[發明專利]一種基于深度學習技術從基因角度預測肝癌風險的方法在審
| 申請號: | 201810592078.5 | 申請日: | 2018-06-11 |
| 公開(公告)號: | CN108733981A | 公開(公告)日: | 2018-11-02 |
| 發明(設計)人: | 劉玉良;張全 | 申請(專利權)人: | 天津科技大學 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20;G06N3/08;G06Q10/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 300222 天津市河西區大沽*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 肝癌 差異表達基因 基因表達數據 基因表達量 固定算法 基因表達 基因聯合 基因治療 積極意義 自動判斷 自動篩選 基因 預測 整合 學習 聯合 | ||
本發明公開了一種基于深度學習技術從基因角度預測肝癌風險的方法。本發明利用深度學習技術,聯合所有基因表達量數據,實現了自動篩選差異表達基因,自動判斷肝癌類型的功能,克服了傳統方法不能整合全部基因表達數據,而忽略基因聯合表達作用的不足;解決了傳統方法運用固定算法,難以把握基因表達的微小差異的缺陷,對肝癌的基因治療的發展具有積極意義。
技術領域
本發明屬于基因工程和人工智能領域,涉及一種基于深度學習技術從基因角度預測肝癌風險的方法。
背景技術
肝癌是世界范圍內最常見的惡性腫瘤之一。目前在我國,肝癌的死亡率已處于惡性腫瘤的第2位,肝癌患者往往采用全身化療的治療手段,其治療效果不明顯,且易復發。因此,確定有價值的診斷標志物及治療靶點對肝癌治療的發展具有重要意義。
現存技術通常先分別對腫瘤組織和正常組織進行基因測序,得到各個基因的基因表達量,比對腫瘤組織和正常組織的基因表達量篩選出差異表達基因,再以差異表達基因的表達量差值判斷腫瘤發生的風險,同時以差異表達基因為靶點指導腫瘤的基因治療。在我國80%~ 94%的肝癌細胞表達AFP,且表達穩定,這為肝癌的基因治療提供了理想的調控靶向。有研究表明,肝癌細胞在細胞遺傳學上的變化包括1p、2p、4p、4q、6q、8p、9p、9q、13q、14q、 16p、16q、17p和18q的雜合性丟失(LOH)及1q、5p、6q、8q、12q、17q、20q和Xq的異常擴增。另外在肝癌中還發現p53,β-catenin和AXIN1基因發生突變。肝癌存在臨床和病理的異質性。通過研究發現,未曾發現上述任一基因存在于所有肝癌當中,因此肝癌的發生機制不盡相同。針對于此,若要研究肝癌的產生與發展,需對腫瘤發生過程中大量基因表達的變化進行研究分析,傳統的單基因方法難以實現。
上述技術需進一步改進:(1)基因數據量較大,存在聯合表達作用,根據基因的單項比對難以確定多基因的聯合作用。(2)通過固定算法篩選差異表達基因難以把握微小的基因差異。因此,提出一種能夠整合所有基因表達數據,可以把握微小差異,可信度高的預測肝癌的方法對肝癌的基因治療的發展具有積極意義。
深度學習這一概念來自人工神經網絡,它指對深層神經網絡進行一系列有效的訓練的技術方法,這種方法具有重構函數,提取相應的特征,并根據提取的特征向量進行分類的功能。因此,本發明提出一種基于深度學習技術從基因角度預測肝癌的方法。
發明內容
本發明提出了一種基于深度學習技術從基因角度預測肝癌風險的方法。
本發明的目的是為了實現自動篩選差異表達基因,自動判斷肝癌類型,克服傳統方法不能整合全部基因表達數據,而忽略基因聯合表達作用的不足;解決傳統方法運用固定算法,難以把握基因表達的微小差異的不足而提出的一種能夠整合所有基因表達數據,可以把握微小差異,可信度高的預測肝癌方法。
本發明是這樣實現的:
訓練數據的獲取;
訓練深度學習模型;
利用訓練完成的深度學習模型預測肝癌。
上述訓練數據的獲取包括:先分別對腫瘤組織和正常組織進行基因測序,得到各個基因的基因表達量。
上述訓練深度學習模型包括:以腫瘤組織和正常組織各個基因的基因表達量做輸入,肝癌類型作為目標輸出,利用梯度下降,反向傳播的方法訓練深度學習模型。整個深度學習模型采用改進的結構的人工神經網絡結構。
上述利用訓練完成的深度學習模型預測肝癌包括:將未知癌癥類型的細胞基因的表達量作為輸入,深度學習模型輸出為癌癥類型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津科技大學,未經天津科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810592078.5/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





