[發明專利]一種基于特征向量實現疾病預測的控制方法及控制裝置在審
| 申請號: | 201811559334.7 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN109378066A | 公開(公告)日: | 2019-02-22 |
| 發明(設計)人: | 顧春宏;徐盛;羅震 | 申請(專利權)人: | 翼健(上海)信息科技有限公司 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200051 上海市長寧區長寧路1*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 向量化 稠密 病例信息 疾病預測 控制裝置 特征向量 矢量 相似度 診斷 疾病 神經網絡模型 疾病類型 交互特征 關聯性 匹配度 整合 匹配 全景 引入 轉換 保留 概率 學習 | ||
1.一種基于特征向量實現疾病預測的控制方法,其通過整合用戶的一個或多個病例信息,確定與用戶病例信息相匹配的每個疾病的概率,其特征在于,包括如下步驟:
a.基于Embedding模型,將一個或多個原始向量化表示轉換為稠密向量化表示;
b.基于診斷模型將所述稠密向量化表示作為輸入,確定所述稠密向量化表示在診斷模型中每個疾病的相似度;
c.基于所述稠密向量化表示在診斷模型中每個疾病的相似度,確定與所述稠密向量化表示匹配度最高的疾病類型。
2.根據權利要求1所述的控制方法,其特征在于,在所述步驟a之前,還包括步驟i:確定用戶的一個或多個病例信息的一個或多個原始向量化表示。
3.根據權利要求2所述的控制方法,其特征在于,所述步驟i包括如下步驟:
i:對用戶病例信息中的非結構化數據信息進行向量化處理,并確定一個或多個第一向量化表示,其中,所述非結構化數據信息包括用戶主訴、病史信息、影像檢查信息;
ii:對用戶病例信息中的結構化數據信息進行向量化處理,并確定一個或多個第二向量化表示,其中,所述結構化數據信息至少包括設備檢驗數據;
iii:將所述第一向量化表示以及所述第二向量化表示作為原始向量化表示。
4.根據權利要求1所述的控制方法,其特征在于,所述步驟b包括:將所述稠密向量化表示輸入到多層殘差網絡結構中,確定一個或多個所述稠密向量化表示所對應的一個或多個疾病相似度;
5.根據權利要求4所述的控制方法,其特征在于,在所述步驟b中,所述診斷模型通過如下步驟獲取:
A.對一個或多個病例的集合進行數據清洗以及向量化處理,確定標準化的向量化數據集,其中,其中,
是各個癥狀等分矢量;
Xo是所有分矢量的連接矢量;
B.基于標準化的向量化數據集、Embedding以及殘差網絡預定義訓練模型;
C.基于損失函數優化所述訓練模型。
6.根據權利要求1所述的控制方法,其特征在于,在所述步驟B中,所述Embedding基于如下公式運算:
其中:
WJ,bj是Embedding操作權重和偏置參數;
是輸入的特征值;
是第j個特征的Embedding結果。
7.根據權利要求6所述的控制方法,其特征在于,在所述步驟B中,所述殘差網絡基于如下公式運算:
XO=F(XI,{W0,W1},{b0,b1})+XI,其中,
XI是輸入向量;
F(XI,{Wo,W1},{bo,b1})表示對XI做兩層的神經網絡計算;
Wo,bo和W1,b1分別是兩層神經網絡的參數;
運算結果(Xo)是神經網絡的輸出,同時加上XI。
8.根據權利要求6所述的控制方法,其特征在于,在所述步驟C中,所述損失函數通過如下公式計算:
其中,
pi表示第i個樣本的正類計算概率(0~1);
yi表示第i個樣本的實際結果(0|1);
N表示樣本的個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于翼健(上海)信息科技有限公司,未經翼健(上海)信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811559334.7/1.html,轉載請聲明來源鉆瓜專利網。





