[發明專利]一種基于排序學習的相似患者檢索方法有效
| 申請號: | 202110098574.7 | 申請日: | 2021-01-25 |
| 公開(公告)號: | CN112836012B | 公開(公告)日: | 2023-05-12 |
| 發明(設計)人: | 蘇胤寧;任江濤 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/338;G06F18/25;G06F18/22;G16H10/60 |
| 代理公司: | 廣州粵高專利商標代理有限公司 44102 | 代理人: | 張金福 |
| 地址: | 510260 廣東*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 排序 學習 相似 患者 檢索 方法 | ||
本發明涉及信息檢索領域,具體公開了一種基于排序學習的相似患者檢索方法,包括以下步驟:構建基于排序學習的患者信息檢索模型;獲取患者病歷文本數據庫,分別組建訓練文本集和測試文本集;對訓練文本集進行數據預處理,再輸入至所構建的基于排序學習的患者信息檢索模型中進行模型訓練;將待測患者病歷文本與測試文本集中每個患者病歷文本組成文本對,輸入訓練得到的基于排序學習的患者信息檢索模型中進行相似度評分,得到最終檢索結果。本發明建立了基于排序學習的檢索模型,將相似患者的檢索轉化為信息檢索任務,并實現有監督學習的過程,取代傳統排序學習中采用的無監督學習方式,解決難以融合多種信息的問題,有效提升相似患者檢索準確率。
技術領域
本發明涉及信息檢索領域,更具體地,涉及一種基于排序學習的相似患者檢索方法。
背景技術
患者相似性分析,是利用患者在特定臨床背景下的歷史信息來衡量一對患者的相似程度,進而實現各種醫學上的應用,如診斷預測、藥物推薦等,其對于臨床護理和精準醫學的發展至關重要。如何在不丟失信息的情況下有效地表示患者是患者相似性分析的關鍵問題。
隨著醫療信息化的發展,電子病歷(EMR)的數量和規模不斷增加,成為了患者相似性研究的重要數據來源。目前,現有的方法主要是將電子病歷中的出入院信息、檢驗、檢查等數據映射到向量空間中,利用向量表示度量患者間的相似度。但這些方法構建向量表示時往往是利用無監督的方式,且需要對專業知識的要求較高。
傳統的檢索模型所考慮的因素并不多,主要是利用詞頻、逆文檔頻率和文檔長度、文檔重要度這幾個因子來人工擬合排序公式。LTR則是基于特征,通過機器學習算法訓練來學習到最佳的擬合公式,相比傳統的排序方法可以考慮多方面的排序影響因素,并能避免過擬合。
在現有技術中,(Jia?Z,Zeng?X,Duan?H,et?al.A?Patient-similarity-basedModel?for?Diagnostic?Prediction[J].International?Journal?of?MedicalInformatics,2019,135:104073.)公開了一種基于病人相似性的診斷預測模型,具體闡述了基于xgboost模型的患者相似性分析方法,利用了人工設計好的度量方式,以無監督的方式對兩患者癥狀、檢驗、初步診斷之間的相似性構造相似性特征向量,再將出院診斷作為一個xgboost模型。雖然該方案提出對相似患者的檢索可通過監督模型來實現,但是采用了無監督的方式構建患者的向量表示,難以融合多種信息,影響檢索準確率。
發明內容
本發明為解決現有技術中采用無監督的方式構建患者的向量表示,難以融合多種信息,影響檢索準確率的問題,提供一種基于排序學習的相似患者檢索方法。
本發明的首要目的是為解決上述技術問題,本發明的技術方案如下:
一種基于排序學習的相似患者檢索方法,包括以下步驟:S1:構建基于排序學習的患者信息檢索模型;S2:獲取患者病歷文本數據庫,分別組建訓練文本集和測試文本集;S3:對訓練文本集進行數據預處理,再輸入至所構建的基于排序學習的患者信息檢索模型中進行模型訓練;S4:將待測患者病歷文本與測試文本集中每個患者病歷文本組成文本對,輸入訓練得到的基于排序學習的患者信息檢索模型中進行相似度評分,得到最終檢索結果。
在上述技術方案中,建立了基于排序學習的檢索模型,將相似患者的檢索轉化為信息檢索任務,并利用已有的訓練文本對模型進行訓練,獲取最優模型,再輸入待測文本,獲取預測結果,完成了有監督學習的過程,從而取代了傳統排序學習中采用的無監督學習方式,解決了難以融合多種信息的問題,有效提升了相似患者檢索的準確率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110098574.7/2.html,轉載請聲明來源鉆瓜專利網。





