[發明專利]相似病例檢索方法、裝置、計算機設備及存儲介質有效
| 申請號: | 202110067822.1 | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112800248B | 公開(公告)日: | 2022-08-05 |
| 發明(設計)人: | 孟祥飛;張振偉;孫華文;孫娜;田曉;馮源 | 申請(專利權)人: | 天河超級計算淮海分中心 |
| 主分類號: | G06F16/38 | 分類號: | G06F16/38;G06F16/35;G06F40/279;G06K9/62 |
| 代理公司: | 北京鍾維聯合知識產權代理有限公司 11579 | 代理人: | 鄭明明 |
| 地址: | 276000 山東省臨*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相似 病例 檢索 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種相似病例檢索方法,其特征在于,所述方法包括:
將目標病例輸入到病例類別識別模型得到與所述目標病例的病例標簽,所述病例類別識別模型是根據樣本病例及樣本病例對應的病例標簽訓練得到的;
所述將目標病例輸入到Seq2Seq病例類別識別模型得到與所述目標病例的病例標簽,包括:
根據目標病例生成病例詞向量(x1,x2,....,xt);t為病例詞向量中詞的數量;將病例詞向量輸入Seq2Seq病例類別識別模型,生成病例標簽(y1,y2,...,yt’);
其中,t’為病例標簽的數量,與t正相關;yi=g(yi-1,Si,Ci),g()是非線性激活函數;Ci=q(h1,h2,....,ht),為第i階段的語義向量,(h1,h2,....,ht)為根據病例詞向量(x1,x2,....,xt)確定的編碼層的輸出,i的取值與t正相關,q()為隱藏層函數,aij為病例詞向量中的xj和病例標簽yi之間的程度權值;eij=a(si-1,hj),j的取值為1...t;a()為關聯函數;Si為根據(h1,h2,....,ht)確定的隱藏層的輸出,Si=f(Si-1,yi-1,Ci);
獲取與所述目標病例的病例標簽對應的病例數據庫,所述病例數據庫中存儲有與所述病例標簽對應的多個病例;
計算所述目標病例與所述病例數據庫中各病例的相似度;
將所述病例數據庫中與所述目標病例相似度大于預置數值的病例確定為所述目標病例的相似病例。
2.根據權利要求1所述的相似病例檢索方法,其特征在于,所述病例標簽包括大標簽、中標簽和小標簽,所述獲取與所述目標病例的病例標簽對應的病例數據庫,包括:
獲取與所述大標簽、所述中標簽和所述小標簽均匹配的病例數據庫。
3.根據權利要求2所述的相似病例檢索方法,其特征在于,所述計算所述目標病例與所述病例數據庫中各病例的相似度,包括:
將所述目標病例與所述病例數據庫中各病例輸入到孿生網絡得到所述病例數據庫中各病例與所述目標病例的相似度。
4.根據權利要求3所述的相似病例檢索方法,其特征在于,所述方法還包括:
獲取每個所述樣本病例對應的大標簽、中標簽和小標簽;
對每兩個所述樣本病例按照所述小標簽的維度進行相似度標記;
根據每兩個所述樣本病例的病例向量,及每兩個所述樣本病例之間的相似度標記進行訓練得到所述孿生網絡。
5.根據權利要求1-4任一所述的相似病例檢索方法,其特征在于,所述方法還包括:
對所述樣本病例分詞、去除停用詞;
將所述樣本病例中的每個詞轉化為詞向量,并根據所有詞的詞向量組成所述樣本病例的病例向量;
對所述病例向量和對應的病例標簽進行訓練得到所述病例類別識別模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天河超級計算淮海分中心,未經天河超級計算淮海分中心許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110067822.1/1.html,轉載請聲明來源鉆瓜專利網。





