[發明專利]一種基于排序學習的相似患者檢索方法有效
| 申請號: | 202110098574.7 | 申請日: | 2021-01-25 |
| 公開(公告)號: | CN112836012B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 蘇胤寧;任江濤 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/338;G06F18/25;G06F18/22;G16H10/60 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 510260 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 排序 學習 相似 患者 檢索 方法 | ||
1.一種基于排序學習的相似患者檢索方法,其特征在于,包括以下步驟:
S1:構建基于排序學習的患者信息檢索模型;
S2:獲取患者病歷文本數據庫,分別組建訓練文本集和測試文本集;
S3:對訓練文本集進行數據預處理,再輸入至所構建的基于排序學習的患者信息檢索模型中進行模型訓練;
S4:將待測患者病歷文本與測試文本集中每個患者病歷文本組成文本對,輸入訓練得到的基于排序學習的患者信息檢索模型中進行相似度評分,得到最終檢索結果;
在所述步驟S1中,所構建的基于排序學習的患者信息檢索模型包括第一編碼層、第二編碼層、交互層、全連接層、預測層;其中:
所述第一編碼層和所述第二編碼層的輸入作為所述基于排序學習的患者信息檢索模型的輸入;
所述第一編碼層輸出端、所述第二編碼層輸出端與所述交互層輸入端連接;
所述交互層輸出端與所述全連接層輸入端連接;
所述全連接層輸出端與所述預測層輸入端連接;
所述預測層的輸出作為所述基于排序學習的患者信息檢索模型的輸出;其中:
將患者病歷文本A輸入所述第一編碼層中進行向量化,得到隱含層向量a;
將患者病歷文本B輸入所述第二編碼層中進行向量化,得到隱含層向量b;
將隱含層向量a、隱含層向量b輸入所述交互層,分別得到患者病歷文本A的最終表示向量a'、患者病歷文本B最終表示向量b'、患者病歷文本A和患者病歷文本B的相似度向量c;其中:
所述交互層包括注意力層、卷積層;其中:
所述注意力層輸入端與所述第一編碼層輸出端、所述第二編碼層輸出端連接;
所述注意力層輸出端與所述卷積層輸入端、所述全連接層輸入端連接;
所述卷積層輸出端與所述全連接層輸入端連接;其中:
將隱含層向量a、隱含層向量b輸入至所述注意力層并進行點乘,得到相似度矩陣;
將相似性矩陣作為注意力權重,在所述注意力層中分別對隱含層向量a、隱含層向量b作加權處理和最大池化處理,得到最終表示向量a'、最終表示向量b';
將相似性矩陣輸入至所述卷積層并進行特征提取,得到相似度向量c;
將最終表示向量a'、最終表示向量b'、相似度向量c輸入所述全連接層進行拼接;
將拼接完成后的向量輸入所述預測層進行相似度評分。
2.根據權利要求1所述的一種基于排序學習的相似患者檢索方法,其特征在于,所述第一編碼層、第二編碼層為雙向的Bi-LSTM。
3.根據權利要求1所述的一種基于排序學習的相似患者檢索方法,其特征在于,所述預測層采用Sigmoid函數作為激活函數。
4.根據權利要求1所述的一種基于排序學習的相似患者檢索方法,其特征在于,在所述步驟S2至S4中,所述患者病歷文本包括患者現病史、體格檢查報告、胸部CT信息。
5.根據權利要求1所述的一種基于排序學習的相似患者檢索方法,其特征在于,在所述步驟S3中,對訓練文本集進行數據預處理,具體為:
S301:對于訓練文本集中每個患者的病歷文本X,在訓練文本集中找到與之診斷相同的患者的病歷文本集Y、與之診斷不同的患者的病歷文本集Z;
S302:對病歷文本集Y、病歷文本集Z中患者的病歷文本進行隨機抽樣;
S303:隨機抽樣完成后,將病歷文本A與病歷文本集Y中每個患者的病歷文本組成正樣本對;將病歷文本A與病歷文本集Z中每個患者的病歷文本組成負樣本對;正樣本對與負樣本對均作為所述基于排序學習的患者信息檢索模型的輸入。
6.根據權利要求5所述的一種基于排序學習的相似患者檢索方法,其特征在于,在步驟S303中,將所組成的正樣本對與負樣本對的比例設置為1:2。
7.根據權利要求5所述的一種基于排序學習的相似患者檢索方法,其特征在于,在步驟S303中,對所組成的正樣本對和負樣本對進行標注,其中正樣本對的標簽為1,負樣本對的標簽為0。
8.根據權利要求1所述的一種基于排序學習的相似患者檢索方法,其特征在于,所述步驟S4具體為:
S401:采用訓練完成的基于排序學習的患者信息檢索模型,依次完成每個文本對的相似度評分;
S402:根據每個文本對的相似度分數依照高低進行自動排序,得到測試文本集中與待測患者相似度最高的患者。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110098574.7/1.html,轉載請聲明來源鉆瓜專利網。





