[發明專利]一種相似病歷智能匹配方法在審
| 申請號: | 202111663667.6 | 申請日: | 2021-12-31 |
| 公開(公告)號: | CN115188440A | 公開(公告)日: | 2022-10-14 |
| 發明(設計)人: | 歐家滿;莫北溪;阮舒華;鄭伊穎;鄧木清;鄧鳳陽 | 申請(專利權)人: | 陽江市人民醫院 |
| 主分類號: | G16H10/60 | 分類號: | G16H10/60;G06F40/194;G06N3/04;G06N3/08 |
| 代理公司: | 廣州藍晟專利代理事務所(普通合伙) 44452 | 代理人: | 歐陽凱 |
| 地址: | 529500 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似 病歷 智能 匹配 方法 | ||
1.一種相似病歷智能匹配方法,其特征在于:包括如下步驟:
步驟一:提取待分析的電子病歷中關鍵字段信息,刪除所提取字段數據中的缺失和重復數據,將關鍵字段文本切分為單個詞符,找出基于詞頻的最大切分組合,得到關鍵字段的詞向量表示;
步驟二:將關鍵字段詞向量作為深度神經網絡預訓練模型的輸入,將三個經過大規模文本數據庫訓練得到的語義模型作為特征提取器,配合全連接網絡實現對關鍵字段詞向量進行遷移特征學習;
步驟三:依據驗證字段與訓練庫已訓練字段的特征向量相似度,對深度遷移特征學習后所得的特征矩陣進行加權融合,結合不同的分類器策略,得到相似病歷的智能匹配結果。
2.根據權利要求1所述一種相似病歷智能匹配方法,其特征在于:所述步驟一的具體實現方法如下:
所述待分析的電子病歷中關鍵字段信息包括主訴、入院診斷、院內檢查及出院診斷四個字段的信息,依據“主訴”、“入院診斷”、“院內檢查”及“出院診斷”四個關鍵詞進行提取;
所述詞向量表示的提取具體包括將關鍵字段文本切分為單個詞符,找出基于詞頻的最大切分組合,使用One-Hot方法獲得待分析文本的詞向量表示。
3.根據權利要求1所述一種相似病歷智能匹配方法,其特征在于:所述步驟二的具體實現方法如下:
將預處理得到的詞向量分別作為深度神經網絡預訓練模型Bert,ALBert和RoBerta的輸入,在每個預訓練模型的末端增加一層全連接層,進行遷移特征學習,完成文本的深度特征提取,形成對應于三個預訓練模型的深度特征矩陣F1,F2,F3。
4.根據權利要求1所述一種相似病歷智能匹配方法,其特征在于:所述步驟三的具體實現方法如下:
計算測試字段與訓練庫已訓練字段的特征向量相似度,具體為:計算測試字段與訓練庫中已訓練字段對應特征向量的余弦相似度,所得余弦相似度形成文本相似度,記為ε1,ε2,ε3,以ε12+ε22+ε32的二次平方根為度量值,取度量值最近鄰10個已訓練特征向量,其與所驗證特征向量之間的余弦相似度值的平均值作為判斷三個深度學習模型習得的特征向量在最終分類任務中的權重值;
對于計算所得的相似度值,滿足時,調用權值分類方案S1;相似度值滿足調用權值分類方案S2;相似度值滿足調用權值分類方案S3;相似度值滿足調用權值分類方案S4;相似度值滿足調用權值分類方案S5;相似度值滿足調用權值分類方案S6;相似度值滿足調用權值分類方案S7;相似度值滿足調用權值分類方案S8;相似度值滿足調用權值分享方案S9。
5.根據權利要求4所述一種相似病歷智能匹配方法,其特征在于:所述權值分類方案S1具體指特征學習后所得特征數據通過加權方式進行數值融合和數值矩陣級聯:Q1={a1×F1特征數值,a2×F2特征數值,a3×F3特征數值};其中,a1,a2,a3為權值,Q1為級聯后的特征數值,將Q1輸入到全連接網絡進行分類,實現相似性匹配任務;
所述權值分類方案S2具體指特征學習后所得特征數據通過加權方式進行數值融合和數值矩陣級聯:Q2={b1×F1特征矩陣,b2×F2特征矩陣,b3×F3特征矩陣};其中,b1,b2,b3為權值,Q2為級聯后的特征數值,將Q2輸入到全連接網絡進行分類,實現相似性匹配任務;
所述權值分類方案S3具體指特征學習后所得特征數據通過加權方式進行數值融合和數值矩陣級聯:Q3={c1×F1特征矩陣,c2×F2特征矩陣,c3×F3特征矩陣};其中,c1,c2,c3為權值,Q3為級聯后的特征數值,將Q3輸入到全連接網絡進行分類,實現相似性匹配任務;
所述權值分類方案S4具體指特征學習后所得特征數據通過加權方式進行數值融合和數值矩陣級聯:Q4={d1×F1特征矩陣,d2×F2特征矩陣,d3×F3特征矩陣};其中,d1,d2,d3為權值,Q4為級聯后的特征數值,將Q4輸入到全連接網絡進行分類,實現相似性匹配任務;
所述權值分類方案S5具體指特征學習后所得特征數據通過加權方式進行數值融合和數值矩陣級聯:Q5={e1×F1特征矩陣,e2×F2特征矩陣,e3×F3特征矩陣};其中,e1,e2,e3為權值,Q5為級聯后的特征數值,將Q5輸入到全連接網絡進行分類,實現相似性匹配任務;
所述權值分類方案S6具體指特征學習后所得特征數據通過加權方式進行數值融合和數值矩陣級聯:Q6={f1×F1特征矩陣,f2×F2特征矩陣,f3×F3特征矩陣};其中,f1,f2,f3為權值,Q6為級聯后的特征數值,將Q6輸入到全連接網絡進行分類,實現相似性匹配任務;
所述權值分類方案S7具體指特征學習后所得特征數據通過加權方式進行數值融合:Q7={g1×F1特征矩陣};其中,g1為權值,Q7為融合后的步態特征數值,將Q7輸入到長短期記憶網絡進行分類,實現相似性匹配任務;
所述權值分類方案S8具體指特征學習后所得特征數據通過加權方式進行數值融合:Q8={h1×F1特征矩陣};其中,h1為權值,Q8為融合后的步態特征數值,將Q8輸入到長短期記憶網絡進行分類,實現相似性匹配任務;
所述權值分類方案S9具體指特征學習后所得特征數據通過加權方式進行數值融合:Q9={i1×F1特征矩陣};其中,i1為權值,Q9為融合后的步態特征數值,將Q9輸入到長短期記憶網絡進行分類,實現相似性匹配任務。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于陽江市人民醫院,未經陽江市人民醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111663667.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:類球紅細菌接合轉化方法
- 下一篇:一種齒輪及其制備方法





