[發明專利]一種基于機器學習算法獲取腫瘤標記物的方法和系統在審
| 申請號: | 202011411176.8 | 申請日: | 2020-12-04 |
| 公開(公告)號: | CN112466389A | 公開(公告)日: | 2021-03-09 |
| 發明(設計)人: | 萬季;葉一林;汪健;夏迪;潘有東;王弈;宋麒 | 申請(專利權)人: | 深圳市新合生物醫療科技有限公司 |
| 主分類號: | G16B5/00 | 分類號: | G16B5/00;G16B20/20;G16B20/30;G16B40/00;G06N20/00 |
| 代理公司: | 北京冠和權律師事務所 11399 | 代理人: | 吳金水 |
| 地址: | 518055 廣東省深圳市南*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 機器 學習 算法 獲取 腫瘤 標記 方法 系統 | ||
1.一種基于機器學習算法獲取腫瘤標記物的方法,其特征在于,所述方法包括:
采集點腫瘤標記物檢測樣本的樣本數據;
對所述樣本數據進行初步特征數據的篩選,獲得特征索引;
將特征索引對應的特征數據取出并拼接形成樣本的特征向量;
根據樣本特征向量進行神經網絡模型的訓練;
利用訓練好的神經網絡模型對腫瘤標記物進行檢測,并輸出真的結果信息。
2.根據權利要求1所述的一種基于機器學習算法獲取腫瘤標記物的方法,其特征在于,所述采集點腫瘤標記物檢測樣本的樣本數據包括染色體、位點、以及定量信息。
3.根據權利要求1所述的一種基于機器學習算法獲取腫瘤標記物的方法,其特征在于,所述對所述樣本數據進行初步特征數據的篩選,獲得特征索引的包括:
利用樣本數據進行構建梯度提升決策樹;
采用sklearn框架對梯度提升決策樹進行訓練;
當梯度提升決策樹訓練完成后,通過numpy.where()函數獲取特征索引。
4.根據權利要求1所述的一種基于機器學習算法獲取腫瘤標記物的方法,其特征在于,所述根據樣本特征向量進行神經網絡模型的訓練包括:
針對神經網絡模型之中的主體神經網絡結構之中的至少一部分層,分別獲得與其中每層的輸出對應的層預測結果;
基于由神經網絡模型的輸出層所輸出的預測結果與樣本數據的真實結果值的差異來構建模型損失函數;
根據所述模型損失函數來調整所述神經網絡模型。
5.根據權利要求1所述的一種基于機器學習算法獲取腫瘤標記物的方法,其特征在于,所述利用訓練好的神經網絡模型對腫瘤標記物進行檢測,并輸出真的結果信息包括:
將腫瘤標記物數據轉換成特征向量作為神經網絡模型的輸入;
根據Sigmoid激活函數對神經網絡模型的輸出進行限制,分類結果向量out的長度將與癌種的數量一致,out中的各位元素表示對應的腫瘤標記物數據對應的患者為對應癌種患者的概率,out中最大值大于0.5時,則代表該特征向量對應的腫瘤標記物數據對應的患者為對應癌癥患者,若out中所有元素均小于0.5,則代表該特征向量對應的腫瘤標記物數據對應的患者不為癌癥患者。
6.一種基于機器學習算法獲取腫瘤標記物的系統,其特征在于,所述系統包括:
采集模塊,用于采集點腫瘤標記物檢測樣本的樣本數據;
篩選模塊,用于對所述樣本數據進行初步特征數據的篩選,獲得特征索引;
拼接模塊,用于將特征索引對應的特征數據取出并拼接形成樣本的特征向量;
訓練模塊,用于根據樣本特征向量進行神經網絡模型的訓練;
檢測模塊,用于利用訓練好的神經網絡模型對腫瘤標記物進行檢測,并輸出真的結果信息。
7.根據權利要求6所述的一種基于機器學習算法獲取腫瘤標記物的系統,其特征在于,所述采集模塊采集的腫瘤標記物檢測樣本的樣本數據包括染色體、位點、以及定量信息。
8.根據權利要求6所述的一種基于機器學習算法獲取腫瘤標記物的系統,其特征在于,所述篩選模塊進行對所述樣本數據進行初步特征數據的篩選,獲得特征索引的具體步驟如下:
利用樣本數據進行構建梯度提升決策樹;
采用sklearn框架對梯度提升決策樹進行訓練;
當梯度提升決策樹訓練完成后,通過numpy.where()函數獲取特征索引。
9.根據權利要求6所述的一種基于機器學習算法獲取腫瘤標記物的系統,其特征在于,所述訓練模塊進行根據樣本特征向量進行神經網絡模型的訓練的具體步驟如下:
針對神經網絡模型之中的主體神經網絡結構之中的至少一部分層,分別獲得與其中每層的輸出對應的層預測結果;
基于由神經網絡模型的輸出層所輸出的預測結果與樣本數據的真實結果值的差異來構建模型損失函數;
以及根據所述模型損失函數來調整所述神經網絡模型。
10.根據權利要求6所述的一種基于機器學習算法獲取腫瘤標記物的系統,其特征在于,所述檢測模塊進行利用訓練好的神經網絡模型對腫瘤標記物進行檢測,并輸出真的結果信息的具體步驟如下:
將腫瘤標記物數據轉換成特征向量作為神經網絡模型的輸入;
根據Sigmoid激活函數對神經網絡模型的輸出進行限制,分類結果向量out的長度將與癌種的數量一致,out中的各位元素表示對應的腫瘤標記物數據對應的患者為對應癌種患者的概率,out中最大值大于0.5時,則代表該特征向量對應的腫瘤標記物數據對應的患者為對應癌癥患者,若out中所有元素均小于0.5,則代表該特征向量對應的腫瘤標記物數據對應的患者不為癌癥患者。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市新合生物醫療科技有限公司,未經深圳市新合生物醫療科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011411176.8/1.html,轉載請聲明來源鉆瓜專利網。





