[發明專利]一種基于癥狀向量的醫學數據處理方法和系統有效
| 申請號: | 201810343909.5 | 申請日: | 2018-04-17 |
| 公開(公告)號: | CN108764280B | 公開(公告)日: | 2021-04-27 |
| 發明(設計)人: | 商顯震;胡滿滿;陳旭;孫毓忠 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/08;G16H50/70 |
| 代理公司: | 北京律誠同業知識產權代理有限公司 11006 | 代理人: | 祁建國;梁揮 |
| 地址: | 100080 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 癥狀 向量 醫學 數據處理 方法 系統 | ||
本發明公開了一種基于癥狀向量的醫學數據處理方法和系統,包括:通過將數據庫中的癥狀進行向量化處理,得到由癥狀向量組成的初始癥狀集合,并根據初始癥狀集合得到疾病向量,集合疾病向量作為初始疾病集合;獲取多個病例樣本,根據病例樣本的樣本向量與疾病向量間的相似度,并結合損失函數對疾病向量和癥狀向量進行更新,以將初始疾病集合和初始癥狀集合分別更新為最終疾病集合和最終癥狀集合;用戶輸入癥狀,根據輸入癥狀與最終癥狀集合中各疾病向量的相似度,對數據庫中的疾病進行篩選,并將篩選出的疾病作為處理結果返回給用戶。
技術領域
本發明涉及醫療數據分析領域,特別涉及一種基于癥狀向量的醫學數據處理方法和系統。
背景技術
計算機科學的不斷進步與信息技術的迅猛發展為醫療服務行業帶來了新的機遇和挑戰,智能診斷或疾病預測等醫療信息系統的相關研究極大促進了醫療信息化產業的迅速發展。疾病的診斷離不開對患者的癥狀和臨床表現的辨別與分析,對以自然語言形式描述的癥狀的分析處理具有越來越重要的意義。
現階段在疾病輔助診斷領域,許多專家學者從各個技術角度進行研究,產生了大量的理論與實踐結果。專利CN 201710259468.6發明公開了一種基于深度學習算法的惡性腫瘤計算機輔助早期診斷方法術,使用深度卷積神經網絡逐層提取圖像的高層次特征,得到的特征圖維度在不斷減小。為了實現輸出概率預測圖和預分割圖像的尺寸匹配,該發明使用反卷積網絡拓展特征圖尺寸,得到尺寸一致的概率預測圖。網絡生成的概率預測圖通過訓練一個softmax分類器,對預測圖像取二值化,獲得最終的前列腺組織的分割結果。
很多專家學者使用深度學習、圖像處理等技術進行疾病輔助診斷的研究。專利CN201710306765.1接收上傳的待診患者的病征圖像,利用深度學習算法提取所述待診患者的病征圖像的待診特征,建立待診特征集,并且將待診特征集與訓練圖庫中各疾病的標準病征圖像的標準特征集進行比對,獲得待診患者的病征圖像與疾病的標準病征圖像之間的圖像相似度,根據圖像相似度確定待診患者患疾病的概率。
自然語言理解的問題要轉化為機器學習的問題,第一步肯定是要找一種方法把這些符號數學化。NLP(Neuro-Linguistic Programming)中最直觀,也是到目前為止最常用的詞表示方法是One-hot Representation(獨熱表示),這種方法把每個詞表示為一個很長的向量。這個向量的維度是詞表大小,其中絕大多數元素為0,只有一個維度的值為1,這個維度就代表了當前的詞。舉個栗子,“話筒”表示為[0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 …],“麥克”表示為[0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 …],每個詞都是茫茫0海中的一個1。這種One-hot Representation如果采用稀疏方式存儲,會是非常的簡潔:也就是給每個詞分配一個數字ID。比如剛才的例子中,話筒記為3,麥克記為8(假設從0開始記)。簡潔的向量表示方法配合最大熵、SVM、CRF等等算法已經很好地完成了NLP領域的各種主流任務。
發明內容
本發明針對目前疾病診斷的查詢主要從以下三方面展開:
1、癥狀的向量化表示與疾病的向量化表示,即在疾病診斷的過程中,對所有的疾病均認為是其所包含癥狀的組合表示,疾病的向量化表示可基于其所含癥狀的向量表示進行表示;
2、使用病例樣本進行癥狀向量更新與疾病向量更新,計算病例樣本與疾病的向量表示的距離并結合損失函數進行反向迭代更新,本發明設計了疾病與病例樣本的向量化表示方法,并設計了距離計算方法與損失函數和迭代更新方法;
3、使用用戶輸入進行疾病輔助診斷工作,本發明設計了方法應用于疾病輔助診斷系統的工作流程和疾病診斷方法。
需要注意的是本發明并不直接作用于人體,可作為醫療輔助工具,輔助醫學教育科研等醫學技術領域。
具體來說本發明具體提供了一種基于癥狀向量的醫學數據處理方法,其中包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810343909.5/2.html,轉載請聲明來源鉆瓜專利網。





