[發明專利]多源異構醫療化驗檢查數據處理方法、裝置、設備和介質在審
| 申請號: | 202110571974.5 | 申請日: | 2021-05-25 |
| 公開(公告)號: | CN113488182A | 公開(公告)日: | 2021-10-08 |
| 發明(設計)人: | 王懷玉;彭蘇元;丁國輝;張路霞 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06F16/28;G06F16/26 |
| 代理公司: | 北京辰權知識產權代理有限公司 11619 | 代理人: | 谷波 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多源異構 醫療 化驗 檢查 數據處理 方法 裝置 設備 介質 | ||
本申請涉及數據處理技術領域,具體來說,本申請涉及多源異構醫療化驗檢查數據處理方法、裝置、設備及介質。所述方法包括:獲取預設疾病化驗檢查指標的多源自定義數據集;對所述多源自定義數據集進行預處理,形成規范化原始數據;將所述規范化原始數據分為預設字段,所述預設字段至少包括指標名稱、計量單位、參考范圍和檢驗結果;建立所述規范化原始數據字段與標準化字段的多對一映射;對映射后結果根據計量單位的標準化系數建立不同計量單位間的可計算模塊,聯動計算檢驗結果,生成通用數據模型。本申請所述方法可減少在數據處理時對人工操作的依賴,提升對常見慢性非傳染性疾病多源異構化驗檢查數據處理的效率。
技術領域
本申請涉及數據處理技術領域,更為具體來說,本申請涉及多源異構醫療化驗檢查數據處理方法、裝置、設備和介質。
背景技術
化驗檢查數據是健康醫療數據的核心類型之一,具有數量龐大、類別繁多和持續激增的特點。鑒于醫療專業的特殊性,傳統數據融合技術難以直接應用于多源異構化驗檢查數據的批量標準化融合。在利用醫療大數據開展醫院管理、區域信息平臺建設、患者隨訪管理、科學研究等等多個方面,多源異構化驗檢查數據的高效標準化整合是亟待突破的技術瓶頸之一。
以常見的重大慢性非傳染性疾病(糖尿病、高血壓、冠心病、慢性腎臟病)為例,上述疾病的發生發展過程常相互促進、互為因果,已經成為我國醫療衛生體系的重大負擔。上述疾病的診療管理需要長期的綜合一體化防治,而在該過程中,相關重點化驗檢查結果的多源共享則是推動疾病分級診療和管理必不可少的環節。隨著患病率持續增加,借助智能化手段進行上述疾病的一體化管理已成為重要的趨勢與手段。然而截至目前,在利用智能化手段改善上述疾病診療和管理的問題上,化驗檢查數據的標準化和融合共享工作局限于單中心或少數中心的專病或專題,分析量相對較小,人工依賴程度高,病種兼容程度低,難以拓展應用于大批量的多源異構化驗檢查數據的整合處理,也尚缺乏在處理過程中覆蓋上述常見重大慢性非傳染性疾病的通用數據模型。
發明內容
為實現上述技術目的,本申請提供了一種多源異構醫療化驗檢查數據的處理方法,包括以下步驟:
獲取預設疾病化驗檢查指標的多源自定義數據集;
對所述多源自定義數據集進行預處理,形成規范化原始數據;
將所述規范化原始數據分為預設字段,所述預設字段至少包括指標名稱、計量單位、參考范圍和檢驗結果;
建立所述規范化原始數據字段與標準化字段的多對一映射;
對映射后結果根據計量單位的標準化系數建立不同計量單位間的可計算模塊,聯動計算檢驗結果,生成通用數據模型。
優選地,所述方法還包括:
根據所述通用數據模型,繪制結果數據分布圖,以及建立多源異構化驗檢查數據的數據統計分析和可視化查驗模塊;
結合所述通用數據模型中每個化驗檢查數據包括的參考范圍,查找異常數據。
優選地,所述方法還包括:
獲取通過所述數據統計分析和可視化查驗模塊對所述通用數據模型的查驗結果;
基于所述通用數據模型的查驗結果,對所述通用數據模型進行優化處理。
具體地,建立所述規范化原始數據字段與標準化字段的多對一映射,包括:
從所述規范化原始數據中獲取文本語義相同的多個指標名稱;
確定所述多個指標名稱對應的標準化指標名稱,建立所述多個指標名稱與所述標準化指標名稱之間的映射關系;
所述標準化指標名稱是基于疾病診斷學、檢驗醫學和單病種國際指南中的一種或多種來確定的。
優選地,所述方法還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110571974.5/2.html,轉載請聲明來源鉆瓜專利網。





