[發明專利]一種基于特征向量實現疾病預測的控制方法及控制裝置在審
| 申請號: | 201811559334.7 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109378066A | 公開(公告)日: | 2019-02-22 |
| 發明(設計)人: | 顧春宏;徐盛;羅震 | 申請(專利權)人: | 翼健(上海)信息科技有限公司 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200051 上海市長寧區長寧路1*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量化 稠密 病例信息 疾病預測 控制裝置 特征向量 矢量 相似度 診斷 疾病 神經網絡模型 疾病類型 交互特征 關聯性 匹配度 整合 匹配 全景 引入 轉換 保留 概率 學習 | ||
本發明提供了一種基于特征向量實現疾病預測的控制方法及控制裝置,包括如下步驟:a.基于Embedding模型,將一個或多個原始向量化表示轉換為稠密向量化表示;b.基于診斷模型將所述稠密向量化表示作為輸入,確定所述稠密向量化表示在診斷模型中每個疾病的相似度;c.基于所述稠密向量化表示在診斷模型中每個疾病的相似度,確定與所述稠密向量化表示匹配度最高的疾病類型,其通過整合用戶的一個或多個病例信息,使用了表示病人全景病癥的超長矢量作為輸入,保留了關聯性假設,通過引入深度的神經網絡模型,來學習超長矢量中的單特征和深度的交互特征,確定與用戶病例信息相匹配的每個疾病的概率,本發明操作簡單,使用方便,具有極高的商業價值。
技術領域
本發明屬于醫學臨床輔助診斷、導診、病例質量控制領域,特別涉及一種基于特征向量實現疾病預測的控制方法及控制裝置。
背景技術
近年來,臨床工作診療中的失誤事件雖鮮有報道,但任何形式的醫療診斷即使在采用最先進的儀器輔助情況下都無法完全避免誤診,因而臨床診斷研究工作的目標之一就是探索誤診發生的規律及防范措施,降低誤診概率,提高確診率,從而推動醫學領域的發展。目前,國內由于醫療資源的局限,使得醫療就診環境中,主治醫生沒有辦法在問診時精確全面細致的去理解每個患者癥狀和體征情況,因此開發一套循證醫學輔助診斷系統用以提高醫生診療水平,改善患者醫療意識,優化醫患雙方院前服務是具有極大價值的。而目前市場上的一些醫療診斷、導診、病例質量控制等系統是基于對電子病歷的分析為基礎,提取病人的主訴、現病史、檢查、家庭史等數據信息矢量化,基于以上矢量進行疾病預測,而其中的預測方式主要分為兩種,即編寫人工預測規則和使用常規的機器學習模型,例如樸素葉斯和邏輯回歸,而以上技術中都存在或多或少的缺點,比如,從病人主訴、現病史、檢查、家庭史中提取的癥狀等矢量化信息,多達上萬維,并且由于矢量長度的限制,現有方式都采取了不同的取舍方式,不能很好的利用這些信息做準確的判斷。
首先,從現有技術的人工規則上來說,需要手動指定信息矢量到疾病的關聯規則,而且還提取每個疾病的主要影響因素,但是這些影響因素的權重都依賴于制定人的主觀判斷,判斷結果可能并不準確,不能很好的體現病人的實際情況,病人的癥狀等信息維度加大,人工規則無法考慮到每一個維度,只能夠重點選擇部分維度,沒有全面性,此外,疾病有上千種,在做疾病概率的排序時,人工規則過于片面化,無法考慮到全局性,不僅如此,人工規則的整理規則效率也極低。其次,從現有的機器學習模型上來說,主要存在以下問題,第一點,常規模型都有受限的應用條件假設,和受限的學習能力,應用無法達到足夠的準確性;舉例來說,樸素貝葉斯假設輸入特征之間是沒有相關性,癥狀,檢查等之間假設沒有相關性是不符合實際情況的,所以模型的結果也是損失精度的;第二點,邏輯回歸等廣義線性模型,保留了癥狀的之間關聯假設,但受限于模型的學習能力,特征間的交互性需要模型的使用者人工指定,在上萬維的特征空間上,發現有意義的交互性,需要大量人工,實際能難實現;第三點,模型學習效率低。
而目前,市場上并沒有一種能夠有效解決上述問題的具體辦法,尤其涉及一種基于特征向量實現疾病預測的控制方法及控制裝置。
發明內容
針對現有技術存在的技術缺陷,本發明的目的是提供一種基于特征向量實現疾病預測的控制方法及控制裝置,根據本發明的一個方面,提供了一種基于特征向量實現疾病預測的控制方法,通過整合用戶的一個或多個病例信息,確定與用戶病例信息相匹配的每個疾病的概率,包括如下步驟:
a.基于Embedding模型,將一個或多個原始向量化表示轉換為稠密向量化表示;
b.基于診斷模型將所述稠密向量化表示作為輸入,確定所述稠密向量化表示在診斷模型中每個疾病的相似度;
c.基于所述稠密向量化表示在診斷模型中每個疾病的相似度,確定與所述稠密向量化表示匹配度最高的疾病類型。
優選地,在所述步驟a之前,還包括步驟i:確定用戶的一個或多個病例信息的一個或多個原始向量化表示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于翼健(上海)信息科技有限公司,未經翼健(上海)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811559334.7/2.html,轉載請聲明來源鉆瓜專利網。





