[發明專利]一種基于遷移學習的醫學數據處理和系統有效
| 申請號: | 201810186122.2 | 申請日: | 2018-03-07 |
| 公開(公告)號: | CN108520780B | 公開(公告)日: | 2021-08-06 |
| 發明(設計)人: | 陳旭;胡滿滿;商顯震;孫毓忠 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F16/35;G06F40/30 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 遷移 學習 醫學 數據處理 系統 | ||
1.一種基于遷移學習的醫學分析系統,其特征在于,包括:
第一訓練模塊,用于獲取醫學領域外的文本數據,根據該文本數據,訓練得到文本分類模型;
病例獲取模塊,用于獲取醫學領域內的病例集合,其中該病例集合包含癥狀和標簽,該標簽為該癥狀對應的病癥;
特征向量提取模塊,使用該文本分類模型提取該癥狀的特征向量作為癥狀向量,并根據該癥狀對應的病癥類型,將該標簽轉化為標簽向量;
第二訓練模塊,用于通過集合該癥狀向量及其對應的標簽向量,構建多標簽訓練樣本集,根據該多標簽訓練樣本集,訓練得到多標簽分類模型;
分析模塊,用于將待分析的醫學樣本輸入至該多標簽分類模型,判斷該醫學樣本屬于每一種標簽的概率值,并根據該概率值得到分析標簽集合,作為該醫學樣本的分析結果。
2.如權利要求1所述的遷移學習的醫學分析系統,其特征在于,該第二訓練模塊具體包括:
將該多標簽訓練樣本集拆分為多個單標簽樣本集,針對該單標簽樣本集采用多次采樣的方式訓練得到每一個標簽的單標簽分類模型,并集合每一個該單標簽分類模型得到該多標簽分類模型。
3.如權利要求2所述的遷移學習的醫學分析系統,其特征在于,該第二訓練模塊還包括:
針對該單標簽樣本集,采用多次采樣的方式訓練多個分類模型,多個分類模型加權集成得到該單標簽分類模型,其中加權的權重由分類模型的分類精度決定。
4.如權利要求2所述的遷移學習的醫學分析系統,其特征在于,該第二訓練模塊還包括:根據驗證集上的效果獲取該單標簽分類模型最佳分類性能時的閾值;該分析模塊包括:判斷該概率值是否大于等于該閾值,若是,則將該概率值對應的標簽加入該分析標簽集合。
5.如權利要求2所述的遷移學習的醫學分析系統,其特征在于,該單標簽分類模型為二分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810186122.2/1.html,轉載請聲明來源鉆瓜專利網。





