[發明專利]一種相似病歷檢索的系統及方法有效
| 申請號: | 201310483241.1 | 申請日: | 2013-10-16 |
| 公開(公告)號: | CN104572675B | 公開(公告)日: | 2018-03-30 |
| 發明(設計)人: | 胡敏;吳俊;王鵬;蔣永 | 申請(專利權)人: | 中國人民解放軍南京軍區南京總醫院 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210002 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 相似 病歷 檢索 系統 方法 | ||
技術領域
本發明涉及一種相似病歷檢索的系統及方法,尤其是在電子病歷的統計檢索中,相似病歷搜索的系統及方法。
背景技術
在目前病歷檢索中,還是采用傳統數據庫字段全匹配的方式來檢索病歷,這種方式需要檢索者提供準確的檢索字段和準確的檢索內容,并且需要原始數據錄制準確,否則無法檢索到期望的結果集。而病歷統計也是通過準確字段進行統計,這局限了對病歷數據的進一步研究分析。而另一方面,全文搜索技術已經相當成熟,可以應用到病歷檢索中,其提供了更加方便、快捷的檢索方法,檢索者不再需要提供檢索字段、不需要提供準確的檢索內容,就能檢索到想要的病歷集,并且通過不斷的提供更多的檢索內容詞來縮小結果集,達到更精確的檢索效果。
檢索相似病歷還局限在傳統的檢索方法基礎上,采用個別字段匹配的方式檢索相似病歷,這導致了檢索的不完全性,可能還有很多相似病歷,卻無法檢索出來,其次沒有一個統一的相似度計算方法,導致檢索出的病歷需要人為的判斷,這使得檢索者的經驗變得非常重要,不便于擴大應用和推廣。
而隨著醫院信息系統的應用和健全,電子病歷數據越來越多,如何把這些病歷數據應用于醫學研究與分析變得越來越重要。本發明就是這樣的背景下被提出來了。
發明內容
本發明提供一種相似病歷的檢索方法和相似度計算方法,為檢索者進一步研究與分析提供一種基礎方法。檢索者提供原始病歷,從病歷庫中檢索出相似的病歷集并計算每一份病歷的相似度的方法。
本發明的技術方案是:
一種相似病歷檢索方法,它包括特征碼字典庫、全文索引庫、原始病歷特征碼提取方法、相似病歷檢索方法、相似度計算方法。
特征碼字典庫:包含疾病分類、檢驗檢查結論;疾病分類采用世界衛生組織《疾病和有關健康問題的國際統計分類(ICD-10)》分類和命名方法;而檢驗檢查結論,因為還沒有一個統一的標準,在本方法中將采用統計方法對病歷庫中的檢驗檢查結論進行統計并標準化。字典庫還包含每一個特征碼的基本評分A=(分類疾病名稱為20,檢驗檢查結論為10分)。
全文索引庫:對病歷庫中的所有病歷建立全文索引,全文索引的建立方法采用當前成熟的全文索引技術,而不同的是索引類別分為:診斷索引、檢驗檢查索引和病歷索引。診斷索引對應病歷中的所有診斷結果,檢驗檢查索引對應病歷中的檢驗檢查結論,病歷索引對應病歷中的所有內容。
原始病歷特征碼提取方法:計算待查病歷的特征碼以及評分。使用全特征碼集合對原始病歷反向檢索,獲取命中的特征碼、索引類別、是否出現“疑似”字串的集合。獲得特征碼集合{An},并對該集合每一個特征碼計算參考評分Ca和總參考分Fa。這種反向特征碼提取方法也可以預先設置好。
相似病歷檢索方法:使用從原始病歷提取的特征碼集合{An},從全文索引庫中檢索匹配的所有病歷,并計算命中的每個特征碼計算得分C和總分F。
相似度計算方法:計算每個被檢索到的病歷的相似度。
1)原始病歷的每一個特征碼的參考評分:Ca=A*(疑似?0.5),原始病歷的總參考評分為:Fa=∑(Ca)=∑(A*(疑似?0.5)),A為特征碼的基本評分,(疑似?0.5)為如果出現疑似則乘0.5。
2)被檢索到的病歷,每個特征碼命中的得分:C=Ca*(索引類別≠原始特征碼索引類別?0.5)。
3)被檢索到的病歷總得分:F=∑(C)=∑(A*(疑似?0.5)*(索引類別≠原始特征碼索引類別?0.5)),(疑似?0.5)為如果出現疑似則乘0.5,(索引類別≠原始特征碼索引類別?0.5)為兩份病歷中的特征碼所在的索引類別不一致則乘0.5。相似度¢=F/Fa。
一種相似病歷檢索系統,它包括以下步驟:如圖1
①為病歷庫中的所有病歷建立全文索引庫,全文索引庫的建立方法采用目前成熟的全文索引技術,其不同的是建立診斷索引、檢驗檢查索引和病歷索引。診斷索引對應病歷中的所有診斷結果,檢驗檢查索引對應病歷中的檢驗檢查結論,病歷索引對應病歷中的所有內容。
②根據特征碼字典庫提取待查原始病歷特征碼。
③計算提取的特征碼的參考評分,以及該待查病歷的總參考評分。
④相似病歷檢索,并計算相似度;使用提取的特征碼從全文索引庫中檢索相似病歷,并根據相似度計算方法計算匹配的病歷的相似度。
⑤從原始病歷庫中讀取相應的病歷并輸出。
⑥對搜索到的相似病歷按照相似度排序,并返回相似病歷集合。
本發明的有益效果:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍南京軍區南京總醫院,未經中國人民解放軍南京軍區南京總醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310483241.1/2.html,轉載請聲明來源鉆瓜專利網。





