[發明專利]一種基于醫療大數據腫瘤診斷的預測方法在審
| 申請號: | 202110993137.1 | 申請日: | 2021-08-25 |
| 公開(公告)號: | CN113707298A | 公開(公告)日: | 2021-11-26 |
| 發明(設計)人: | 景元明;張林;陳艷 | 申請(專利權)人: | 景元明;張林;陳艷 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G06K9/62;G06N20/00 |
| 代理公司: | 廣東知產貓知識產權代理有限公司 44513 | 代理人: | 吳霜 |
| 地址: | 312000 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 醫療 數據 腫瘤 診斷 預測 方法 | ||
本發明公開了一種基于醫療大數據腫瘤診斷的預測方法,包括數據挖掘和模型構建,數據挖掘包括前期收集的近三年腫瘤標志物大數據,模型構建包括5?8種腫瘤良惡性模型,以邏輯回歸,隨機森林和支持向量機以及增強學習四種機器學習的方法對相關數據進行分析和預測,本發明方法合理,研究人員將收集與各種與體檢和腫瘤相關的醫療記錄中的標志物,包括年齡性別等指標,并根據已知的腫瘤數據來判斷腫瘤是惡性的還是良性的,進行迭代訓練后,通過機器學習的各種算法用于估計腫瘤的良惡性,可以為癌癥領域提供具有潛力的預測工具,通過機器學習的方法對腫瘤的良惡性進行區別有非常有益的應用前景,結果可靠,準確度高,特異性好。
技術領域
本發明涉及醫學大數據利用技術領域,特別涉及一種基于醫療大數據腫瘤診斷的預測方法。
背景技術
癌癥是一個復雜的疾病,而其發病率在逐年增多,各國對于癌癥的治療也是一筆天文數字的支出,如何對癌癥進行早期診斷從而及時治療,這是各國科學家一直在不懈研究的課題,而如何擴大篩選規模并降低醫療成本亦是一個巨大的挑戰,每個腫瘤往往擁有多個驅動基因和復雜的信號傳導通路異常,但是對于癌癥的早期診斷一直是個棘手的問題,如何通過簡單的手段來預測早期腫瘤或者通過對患者的血液檢驗指標并通過算法進行判斷是一個重要和緊迫的問題。對以上問題,以下提出一種解決方案。
發明內容
本發明的目的是提供一種基于醫療大數據腫瘤診斷的預測方法,具有結果可靠、準確度高、特異性好的優點。
本發明的上述技術目的是通過以下技術方案得以實現的:
一種基于醫療大數據腫瘤診斷的預測方法,包括數據挖掘和模型構建,所述數據挖掘包括前期收集的近三年腫瘤標志物大數據,所述模型構建包括5-8種腫瘤良惡性模型,以甲狀腺、肺和肝三個器官中良性和惡性腫瘤的區分和判別,以邏輯回歸,隨機森林和支持向量機以及增強學習四種機器學習的方法對相關數據進行分析和預測。
作為優選,所述甲狀腺癌良性和惡性腫瘤區分判別,通過甲狀腺各變量相關性示意圖的相關性分析,且通過邏輯回歸、隨機森林、支持向量機和增強學習四種模型對變量進行模型構建和預測。
作為優選,所述甲狀腺模型構建和預測后,選擇的Age+R8+R11標志物,在邏輯回歸模型下,預測效果最好,選擇糖類抗原199和鱗狀細胞癌相關抗原以及年齡三個變量的情況下,通過邏輯回歸的方法對甲狀腺良惡性腫瘤的預測有較好的預測準確率,準確率可達到0.76,AUC值到0.685。
作為優選,所述肺癌良性和惡性腫瘤區分判別,通過肺的良惡性腫瘤各變量的相關性分析,且通過邏輯回歸、隨機森林、支持向量機和增強學習四種模型對變量進行模型構建和預測。
作為優選,所述肺四種模型的AUC值分別為:0.785,0.821,0.746,0.762,最優的預測模型是:隨機森林模型,預測準確性0.76,AUC值為0.821,從重要變量性排名來看:R6R3R7SEXR10R1R8,且通過基尼指數可知,R6,R3,R10,R1和R7都屬于高分數參數,和重要性排名比較一致,可以用于未來的臨床考察指標。
作為優選,所述肝癌良性和惡性腫瘤區分判別,同樣進行邏輯回歸,隨機森林,支持向量機以及增強學習4種模型分析,所有模型都是隨機選取50%的樣本作為訓練樣本,另外50%作為驗證樣本結果發現隨機森林的預測準確性最高為0.81。
作為優選,所述通過肝ROC曲線看出,四種模型的AUC值分別為0.748,0.814,0.690和0.686,因此,依然是隨機森林具有最好的分類效果。預測準確性為0.81,AUC值為0.814,從基尼指數上看,R6,R4,R3,R9,R10屬于高效率的預測因子,這個結果與變量重要性排名和差異p值結果幾乎一致因此,未來R6,R4,R3,R9,R10可以作為臨床預測重要的分子標志物。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于景元明;張林;陳艷,未經景元明;張林;陳艷許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110993137.1/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





