[發明專利]一種基于機器學習的IVF-ET早孕胚胎發育預測系統在審
| 申請號: | 201810959476.6 | 申請日: | 2018-08-22 |
| 公開(公告)號: | CN109214437A | 公開(公告)日: | 2019-01-15 |
| 發明(設計)人: | 林愷;李喜紅;劉麗玨;歐陽妍;吳青青;林戈;李儀;穆陽 | 申請(專利權)人: | 湖南自興智慧醫療科技有限公司;湖南霖德醫療產業有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N99/00;G16H50/70 |
| 代理公司: | 長沙明新專利代理事務所(普通合伙) 43222 | 代理人: | 葉舟 |
| 地址: | 410013 湖南省長沙市長沙高新開*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于機器 胚胎發育 預測系統 早孕 測試集 訓練集 預處理 數據處理步驟 病例數據 機器模型 決策支持 臨床診斷 平衡數據 評價模型 隨機采樣 特征數據 樣本采用 異常標記 預測結果 數據集 構建 學習 樣本 均衡 診斷 引入 | ||
1.一種基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,包括用于輸入歷史病例數據并形成結構化數據集的數據輸入單元;輸入單元還用于輸入新病例數據、用于對結構化數據集進行預處理和提取特征的預處理單元、根據已知的臨床診斷結果,對歷史病例數據進行正常或異常標記的數據標記單元、根據對歷史病例數據進行正常或異常標記的數據對訓練預測模型的訓練單元和對新病例數據給出預測結構的預測單元;訓練單元對抽取結構化數據集數據形成訓練集,對訓練集的異常樣本采用SMOTE采樣方法使樣本達到均衡。
2.如權利要求1所述的基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,所述結構化數據集,包含6W正常樣本,2.5W異常樣本;預處理單元對結構化數據集進行異常值、缺失值的檢查和處理。
3.如權利要求2所述的基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,所述預處理單元的預處理步驟如下:
步驟S21:將歷史病例數據按照某特征的特征值劃分為N層進行抽樣,第i層的非缺失樣本數為Ai,缺失樣本數為Bi,對于第i層,每次從Ai中隨機采樣1個樣本來填充缺失值,共采樣Bi次,第i層的采樣公式為bij=sample(Ai,Bi),i=1,2....N,j=0,1,2....B;bij表示第i層的第j個采樣;sample()表示隨機采樣函數;B表示采樣次數;
步驟S22:對歷史病例數據的離散值進行獨熱編碼向量化;
步驟S23:病例特征Z-score標準化:xi為病例特征,則標準化結果如下:
i=1,2,3...n.
其中為標準化后的特征值,為病例特征的平均值;為病例特征的標準差,處理后值域在區間[-1,1]內。
4.如權利要求1所述的基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,所述數據標記單元按照胚胎實際發育情況:正常標記為0,異常為1。
5.如權利要求1所述的基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,訓練單元對異常樣本采用SMOTE采樣方法包括以下步驟:
步驟S41:異常樣本數為T,針對異常樣本c,其特征向量為Nc,c∈{1,...,T};
步驟S42:首先從全部異常樣本T中采用歐式距離找到Nc的k個近鄰,記為Nc(near),near∈{1,...,k};
步驟S43:然后從k個近鄰中隨機選擇一個樣本Nc(nn),再生成一個0到1之間的隨機數ζ1,從而合成一個新的樣本Nc1:
Nc1=Nc+ζ1·(Nc(nn)-Nc)
步驟S44:重復步驟S43M次,從而可以合成M個新樣本:Ncnew,new∈1,...,M,對于全部的T個異常樣本進行上述操作,即可合成MT個新樣本。
6.如權利要求1所述的基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,所述訓練模型為單一模型或BP神經網絡模型或集成模型。
7.如權利要求6所述的基于機器學習的IVF-ET早孕胚胎發育預測系統,其特征在于,采用五折交叉驗證、網格搜索方法對單一模型、BP神經網絡模型和集成模型進行調參,將多個模型的輸出結果進行比較,選擇評價指標最高的模型作為最終的預測模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南自興智慧醫療科技有限公司;湖南霖德醫療產業有限公司,未經湖南自興智慧醫療科技有限公司;湖南霖德醫療產業有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810959476.6/1.html,轉載請聲明來源鉆瓜專利網。





