[發明專利]罕見病知識庫的處理方法及裝置、可讀存儲介質有效
| 申請號: | 202011644230.3 | 申請日: | 2020-12-31 |
| 公開(公告)號: | CN112687397B | 公開(公告)日: | 2023-05-09 |
| 發明(設計)人: | 張睿;王覓也 | 申請(專利權)人: | 四川大學華西醫院 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F40/247;G06F40/30 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張萌 |
| 地址: | 610000 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 罕見 知識庫 處理 方法 裝置 可讀 存儲 介質 | ||
1.一種罕見病知識庫的處理方法,其特征在于,包括:
獲取多個罕見病患者的電子病歷;
從所述電子病歷中提取出可用數據;所述可用數據包括:多個臨床表型術語、所述多個臨床表型術語各自對應的罕見病、以及用于表征所述多個臨床表型術語和其各自對應的罕見病之間的關聯程度的統計信息;
獲取罕見病權威知識庫;所述罕見病權威知識庫中包括多種罕見病和所述多種罕見病對應的多個標準表型術語;
將所述多個臨床表型術語與所述多個臨床表型術語各自對應的罕見病對應的多個標準表型術語進行比較;
根據比較結果對所述罕見病權威知識庫進行優化,得到優化的罕見病權威知識庫;所述優化的罕見病權威知識庫中的各個標準表型術語對應有所述統計信息。
2.根據權利要求1所述的方法,其特征在于,所述根據比較結果對所述罕見病權威知識庫進行優化,得到優化的罕見病權威知識庫,包括:
將存在匹配的標準表型術語的臨床表型術語對應的統計信息按照與所述匹配的標準表型術語的對應關系存儲到所述罕見病權威知識庫中。
3.根據權利要求2所述的方法,其特征在于,所述方法還包括:
獲取不存在匹配的標準表型術語的目標臨床表型術語;
計算所述目標臨床表型術語在其所述對應的罕見病中的出現頻率;
若所述出現頻率大于或者等于預設頻率,且所述目標臨床表型術語屬于所述多個標準表型術語中的上位概念,不存儲所述目標臨床表型術語;
若所述出現頻率大于或者等于預設頻率,且所述目標臨床表型術語屬于所述多個標準表型術語的下位概念,將所述目標臨床表型術語和其對應的統計信息存儲到所述罕見病權威知識庫中。
4.根據權利要求1至3任一項所述的方法,其特征在于,所述方法還包括:
針對不存在匹配的臨床表型術語的標準表型術語,確定是否存在未進行匹配的臨床表型術語;
在確定不存在未進行匹配的臨床表型術語時,從所述罕見病權威知識庫中刪除所述不存在匹配的臨床表型術語的標準表型術語。
5.根據權利要求1所述的方法,其特征在于,在所述根據比較結果對所述罕見病權威知識庫進行優化,得到優化的罕見病權威知識庫后,所述方法還包括:
獲取目標患者的電子病歷;
從所述電子病歷中提取出目標臨床表型術語;
將所述目標臨床表型術語與所述優化的罕見病權威知識庫中的標準表型術語進行匹配;
在確定所述目標臨床表型術語存在匹配的標準表型術語時,根據所述匹配的標準表型術語對應的統計信息確定所述目標臨床表型術語對應的目標罕見病并反饋。
6.根據權利要求1所述的方法,其特征在于,所述獲取罕見病權威知識庫,包括:
獲取已有的遺傳病知識庫和罕見病知識庫;
從所述遺傳病知識庫和所述罕見病知識庫中分別提取出多種已知罕見病和所述多種已知罕見病對應的已知表型術語;
基于所述多種已知罕見病和所述多種已知罕見病對應的已知表型術語構建所述罕見病權威知識庫。
7.根據權利要求6所述的方法,其特征在于,所述遺傳病知識庫包括:OMIM庫;所述罕見病知識庫包括:Orpha庫和eRAM庫。
8.根據權利要求1所述的方法,其特征在于,所述從所述電子病歷中提取出可用數據,包括:
基于已有的術語庫從所述電子病歷中提取出所述多個臨床表型術語;
根據所述電子病歷中的患者診斷結果確定所述多個臨床表型術語各自對應的罕見病;
統計各個罕見病下的多個臨床表型術語的頻數以及TF-IDF信息,得到所述統計信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學華西醫院,未經四川大學華西醫院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011644230.3/1.html,轉載請聲明來源鉆瓜專利網。





