[發明專利]基于綜合特征表示與改進寬深度模型的相似病例推薦方法有效
| 申請號: | 201910490881.2 | 申請日: | 2019-06-06 |
| 公開(公告)號: | CN110299194B | 公開(公告)日: | 2022-11-08 |
| 發明(設計)人: | 黃青松;楊承啟;王藝平;劉利軍;馮旭鵬 | 申請(專利權)人: | 昆明理工大學 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G16H50/70;G06F40/289;G06F40/30;G06F40/242;G06F16/83;G06F21/62;G06N3/04 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 綜合 特征 表示 改進 深度 模型 相似 病例 推薦 方法 | ||
1.基于綜合特征表示與改進寬深度模型的相似病例推薦方法,其特征在于:所述方法具體步驟如下:
Step1、首先對文本進行醫療文本脫敏,并對醫療文本分詞;將中醫特色名詞術語、中醫基礎理論名詞、中醫獨特的病名和癥名、中醫治則治法名詞和中藥方劑名詞,加入THULAC詞庫,并使用THULAC進行分詞,得到以詞為單位的語料表示;
Step2、對電子病歷文本進行特征分區,將離散特征映射成實值向量;將連續特征根據Step1中步驟進行分詞,使用Word2Vec得到語料的詞向量表示;
Step3、構建基于門限卷積變分自編碼器的綜合特征表示模型;首先,根據Step2中的特征分區,將兩部分特征進行維度的融合,其中連續特征采用基于門限卷積變分自動編碼器算法進行特征表示;最后,得到中醫電子病歷中的高級語義信息表示;
Step4、構建基于改進寬深度模型的相似病例推薦模型;分別對每個醫生分別構建相似病例推薦模型;根據Step3得到的病歷綜合特征表示,排序輸出數十個病例推薦項給醫生;
所述步驟Step3中,連續特征采用基于門限卷積變分自動編碼器算法進行特征表示的具體步驟為:
Step3.1、利用門限卷積網絡進行編碼,將Step2所得連續特征送入池化層得到編碼結果;并使用上述編碼結果計算生成均值和方差,生成高斯分布并且重新采樣;
Step3.2、構建雙層堆疊CNN模型,將非線性激活函數的卷積層輸出與經過了sigmoid非線性激活函數激活的卷積層輸出相乘其中:W和V表示卷積層的權重,b和c表示卷積層的偏置項,*表示卷積操作運算,σ為門限卷積函數;
Step3.3、損失函數為logp(x)=DKL(qφ(z|x)||pθ(z|x)),使得最終的損失函數達到最小;其中,θ為優化參數,logp(x)表示模型需要最大化的對數似然函數,DKL為KL散度,qφ(z|x)為編碼器,pθ(x|z)為解碼器,z為隱變量,x為輸入變量;當且僅當qφ(z|x)=pθ(z|x)時,DKL(qφ(z|x)||pθ(z|x))=0;
Step3.4、采用隨機梯度上升法來更新參數訓練網絡模型;首先利用先驗分布隨機采樣一組隱藏變量z的樣本,然后輸入到解碼器,最后輸出一個數據點x的隨機樣本;考慮不同數量的隱藏單元n,可以小于或高于原始特征的數量;
所述步驟Step4的具體步驟為:
Step4.1、定義邏輯回歸模型這里x=[x1,x2,…,xd]表示特征d的一組向量,特征集合內包含了原始輸入特征與組合特征,w=[w1,w2,…,wd]表示模型的參數;
Step4.2、定義交叉特征這里cki∈{0,1}為布爾值,當第i個特征為第k個轉換φk的一部分,cki即為1,否則為0,對于二進制特征,有且僅當組合特征全部成立才是1,否則就是0;
Step4.3、定義深度模塊的核心GRU層,并在最后一層和輸出之間添加額外的前饋層,其中使用tanh函數作為輸出層的激活函數;在隱藏層節點之間加入連接,并用一個門循環單元來控制隱藏節點的輸出,有效得建模特征在時序動態上的變化;
Step4.4、將淺層部分的輸入特征包括由地域特征、天氣時節以及搜索關鍵詞構成的交叉特征作為輸入,批量隨機優化模型參數,同時再反向傳播到模型的淺層和深度門循環部分;
Step4.5、定義聯合模型預測函數使用聯合輸出結果取對數的加權和作為預測值,然后將該加權和饋送到一個共同的損失函數,進行聯合訓練并優化;最終輸出為概率值;其中,為寬深度模型參數,為GRU模型參數;最后使用概率由低到高進行排序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于昆明理工大學,未經昆明理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910490881.2/1.html,轉載請聲明來源鉆瓜專利網。





