[發明專利]基于深度學習的腫瘤早期篩查方法、裝置、設備及介質在審
| 申請號: | 201810145237.7 | 申請日: | 2018-02-11 |
| 公開(公告)號: | CN108416190A | 公開(公告)日: | 2018-08-17 |
| 發明(設計)人: | 謝文傳;江向武;白楊;李榮;劉亮;曹彬彬;楊金華;游君霞;舒寧;姚利;范秋麗;杜崗 | 申請(專利權)人: | 廣州市碳碼科技有限責任公司 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20;G06F19/24 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 麥小嬋;郝傳鑫 |
| 地址: | 510070 廣東省廣州市高新技術產業開*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 類別屬性 基因序列 目的基因 早期篩查 樣本 計算機可讀存儲介質 腫瘤 腫瘤分類模型 表達水平 基因測序 數據分析 有效表達 終端設備 概率 學習 人群 疾病 預測 | ||
本發明公開了一種基于深度學習的腫瘤早期篩查方法、裝置、終端設備及計算機可讀存儲介質,其方法包括下列步驟:獲取通過基因測序的樣本的基因序列;對所述基因序列進行數據分析,以獲取目的基因的有效表達水平;根據所述目的基因的表達水平,通過腫瘤分類模型對所述樣本的類別屬性進行預測;獲取各個類別屬性的概率,以根據概率最大的類別屬性生成疾病風險建議,成本低,周期短,適用于各類人群。
技術領域
本發明計算機醫療技術領域,尤其涉及一種基于深度學習的腫瘤早期篩查方法、裝置、終端設備及計算機可讀存儲介質。
背景技術
現有針對腫瘤早期篩查的技術包括:血清學腫瘤標志物(如胚胎性抗原、腫瘤抗原、酶和同工酶、血漿蛋白、細胞代謝產物、異位激素、癌基因和抑癌基因蛋白產物及某些微量元素等)、影像學(如超聲、CT、MRI、PET、PET-CT)、循環腫瘤細胞(CTC)和循環腫瘤DNA(ctDNA)檢測等。
在實現本發明的過程中,發明人發現現有技術中至少存在如下問題:
血清學腫瘤標志物解決方案是目前較為普及的方案,對特定區域人群的腫瘤普查及高危人群進行定期的腫瘤排除和篩查有提示性作用。單個腫瘤標志物的檢測敏感性低,多個腫瘤標志物聯合檢測雖提高了敏感性,卻降低了特異性。因此需權衡兩個指標的前提下選定腫瘤標志物。此外,人體在良性疾病、生理變化時會引起腫瘤標志物表達增加。如妊娠時甲胎蛋白(AFP)、糖類抗原125(CA125)、人絨毛膜促性腺激素含量升高。而AFP是原發性肝癌的高特異性和高靈敏度的腫瘤標志物,CA125是卵巢癌標志物。
影像學方法篩查主要用于中晚期腫瘤的診斷,對部分早癌的發現有一定效果,雖然其可快速定位腫塊位置,但服用放射性示蹤劑存在較大副作用,且不能發現癌前病變,不能鑒別腫瘤快的良惡性程度等。以CT為例,CT掃描篩查是一個耗時、費用高的方案,且其對腸胃系統的診斷存在缺陷,受腸壁薄、呼吸道內氣體、消化液及食物殘渣等的影像,篩查早期腫瘤尤其困難。MRI檢查效率低、定性診斷困難、且對鈣化病灶顯示不敏感。PET-CT須使用微量放射性同位素,造成體內會有少許的殘留,且診療費用極高。
發明內容
針對上述問題,本發明的目的在于提供一種基于深度學習的腫瘤早期篩查方法、裝置、終端設備及計算機可讀存儲介質,成本低,周期短,適用于各類人群。
第一方面,本發明實施例提供了一種基于深度學習的腫瘤早期篩選方法,包括以下步驟:
獲取通過基因測序的樣本的基因序列;
對所述基因序列進行數據分析,以獲取目的基因的有效表達水平;
根據所述目的基因的表達水平,通過腫瘤分類模型對所述樣本的類別屬性進行預測;
獲取各個類別屬性的概率,以根據概率最大的類別屬性生成疾病風險建議。
在第一方面的第一種實現方式中,所述基因測序包括RNA-seq測序及qPCR測序。
在第一方面的第二種實現方式中,所述對所述基因序列進行數據分析,以獲取目的基因的有效表達水平,具體為:
對所述基因序列進行預處理,以獲取預處理后的基因序列的表達水平;其中,所述預處理包括數據格式轉換、清洗、缺失值分析及離群值分析;
通過特征選擇算法對所述基因序列的表達水平進行特征選擇,以獲取目的基因的有效表達水平;其中,所述目的基因的特征基因數目小于200,所述特征選擇算法包括皮爾森相關系數矩陣及卡方檢驗。
在第一方面的第三種實現方式中,
通過支持向量機算法、樸素貝葉斯算法或者堆疊去噪自編碼器算法構建所述腫瘤分類綜合模型。
第二方面,本發明實施例提供了一種基于深度學習的腫瘤早期篩選裝置,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州市碳碼科技有限責任公司,未經廣州市碳碼科技有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810145237.7/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





