[發明專利]一種醫療數據處理方法及裝置在審
| 申請號: | 201711339040.9 | 申請日: | 2017-12-14 |
| 公開(公告)號: | CN108182963A | 公開(公告)日: | 2018-06-19 |
| 發明(設計)人: | 崔金夢;崔樂樂 | 申請(專利權)人: | 山東浪潮云服務信息科技有限公司 |
| 主分類號: | G16H10/00 | 分類號: | G16H10/00 |
| 代理公司: | 濟南信達專利事務所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 醫療數據 醫療數據處理 關系型數據庫 數據類型 預設數據 清洗 分布式數據庫 數據處理規則 醫療數據采集 采集方式 清洗處理 自動處理 大數據 預設 費力 采集 | ||
本發明提供了一種醫療數據處理方法及裝置,該方法包括:針對每一類醫療數據均執行:利用當前醫療數據的數據類型所對應的預設數據采集方式,將當前醫療數據采集到該數據類型對應的關系型數據庫;將各關系型數據庫中的醫療數據導入到一分布式數據庫時,根據預設數據清洗規則對采集到的醫療數據進行清洗處理;根據預設數據處理規則,對清洗后的醫療數據進行匯總處理。基于大數據技術以自動處理海量醫療數據,故本方案能夠解決現有醫療數據處理費時費力的問題。
技術領域
本發明涉及計算機技術領域,特別涉及一種醫療數據處理方法及裝置。
背景技術
在現今社會,醫療和健康數據呈幾何級增長趨勢急劇擴容,使得醫療數據數量龐大。
目前,工作人員可以按需查詢分析部分特定醫療數據,以從中獲得有用信息。
但是,當醫療數據數量龐大時,現有實現方式費時費力。
發明內容
本發明提供了一種醫療數據處理方法及裝置,能夠解決現有醫療數據處理費時費力的問題。
為了達到上述目的,本發明是通過如下技術方案實現的:
一方面,本發明提供了一種醫療數據處理方法,包括:
針對至少一類醫療數據中的每一類醫療數據均執行:根據當前醫療數據的數據類型,利用所述數據類型對應的預設數據采集方式,將所述當前醫療數據采集到所述數據類型對應的關系型數據庫;
將每一個所述關系型數據庫中的醫療數據導入到一分布式數據庫時,根據預設數據清洗規則,對采集到的所述醫療數據進行清洗處理;
根據預設數據處理規則,對清洗后的所述醫療數據進行匯總處理。
進一步地,所述數據類型為結構化數據時,所述預設數據采集方式包括:利用kettle中的輸入組件以進行醫療數據的輸入,并采用正則表達式對輸入的醫療數據進行匹配;其中,所述輸入組件包括Access輸入、CSV(Comma-Separated Values,逗號分隔值)文件輸入、數據庫表輸入、OLAP(Online Analytical Processing,聯機分析處理)輸入、RSS(Really Simple Syndication,簡易信息聚合)輸入、Cube輸入中的任意一種;
所述數據類型為半結構化數據,且所述醫療數據來源于網頁時,所述預設數據采集方式包括:采用機器學習技術、交互式元數據知識模型建模、引導學習方法對xml(Extensible Markup Language,可擴展標記語言)文件中的醫療數據進行抽??;
所述數據類型為非結構化數據時,所述預設數據采集方式包括:使用3種線型模型來表示表格,并采用模糊匹配方法識別表格中直線行上的字段;針對手寫漢字文件中的醫療數據,使用引力搜索算法識別并抽取表格中的漢字。
進一步地,所述預設數據清洗規則包括:通過維護源數據文件相關的元數據,利用信息復寫方法進行數據映射轉換,以將醫療數據復寫為具有預設數據格式的醫療數據;利用kettle中的轉換組件,對源數據庫中不存在的醫療數據,進行拆分字段、字段選擇、剪切字符串中的任一處理操作;利用所述轉換組件,基于N Grams距離法、快速過濾法、基本近鄰排序方法、多趟排序近鄰方法和優先隊列策略中的任一方法,檢測待清洗醫療數據中的重復數據,并對檢測出的重復數據進行去重處理;利用kettle執行多進程、多線程、流水、多處理器中的任一技術,以進行醫療數據的并行增量處理;
其中,所述轉換組件包括排序記錄、去除重復記錄、哈希值計算中的任意一種。
進一步地,所述預設數據處理規則包括:基于物理數據模型定義的表結構,將醫療數據裝入預設數據庫內部數據表中,其中,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東浪潮云服務信息科技有限公司,未經山東浪潮云服務信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711339040.9/2.html,轉載請聲明來源鉆瓜專利網。





