[發明專利]一種基于癥狀向量的醫學數據處理方法和系統有效
| 申請號: | 201810343909.5 | 申請日: | 2018-04-17 |
| 公開(公告)號: | CN108764280B | 公開(公告)日: | 2021-04-27 |
| 發明(設計)人: | 商顯震;胡滿滿;陳旭;孫毓忠 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;G16H50/70 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 癥狀 向量 醫學 數據處理 方法 系統 | ||
1.一種基于癥狀向量的醫學數據處理系統,其特征在于,包括:
向量化處理模塊,通過將數據庫中的癥狀進行向量化處理,得到由癥狀向量組成的初始癥狀集合,并根據該初始癥狀集合得到疾病向量,集合該疾病向量作為初始疾病集合;
集合更新模塊,用于獲取多個病例樣本,根據該病例樣本的樣本向量與疾病向量間的相似度,并結合損失函數對疾病向量和癥狀向量進行更新,以將該初始疾病集合和該初始癥狀集合分別更新為最終疾病集合和最終癥狀集合;
篩選模塊,用戶輸入癥狀,根據該輸入癥狀與該最終癥狀集合中各疾病向量的相似度,對該數據庫中的疾病進行篩選,并將篩選出的疾病作為處理結果返回給用戶;
其中,該損失函數具體為:
其中,mk為病例樣本(xi,yi)的疾病集yi中疾病的序號,k表示疾病是yi中的第k個疾病,K表示yi中共有K個疾病標簽;
且該集合更新模塊包括:
獲取該樣本向量與該初始疾病集合中疾病向量的距離,通過對距離進行排序,為該樣本向量對應的病例樣本中各疾病分配序號,以生成損失函數,并通過該損失函數和深度學習優化算法反向優化該初始癥狀集合,將該初始癥狀集合更新為該最終癥狀集合;
使用該最終癥狀集合重新計算疾病向量,以將該初始疾病集合更新為該最終疾病集合。
2.如權利要求1所述的基于癥狀向量的醫學數據處理系統,其特征在于,該向量化處理模塊包括:
使用TransE模型對癥狀進行向量化處理;
根據以下公式計算疾病向量:
其中,為癥狀的向量表示,上標k表示癥狀是疾病Di中的第k個癥狀,疾病Di中共有K個癥狀。
3.如權利要求1所述的基于癥狀向量的醫學數據處理系統,其特征在于,
該集合更新模塊中對于給定的病例樣本(xi,yi),其中xi表示病例樣本(xi,yi)的癥狀集合,表示集合xi中的第j個癥狀,該病例樣本的癥狀數為J;yi表示病例樣本(xi,yi)對應的疾病集合,表示集合yi中的第k個疾病標簽,該病例樣本的疾病標簽數為K,同時疾病標簽屬于疾病集合D;
該樣本向量表示為:
其中,為癥狀的向量表示,上標j表示癥狀是病例樣本中(xi,yi)的第j個癥狀,病例樣本中(xi,yi)中共有J個癥狀。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810343909.5/1.html,轉載請聲明來源鉆瓜專利網。





