[發明專利]一種海量多結構化醫學數據聚合處理辦法在審
| 申請號: | 202010989109.8 | 申請日: | 2020-09-18 |
| 公開(公告)號: | CN112086201A | 公開(公告)日: | 2020-12-15 |
| 發明(設計)人: | 卜曉軍;姚斌;馬汝輝 | 申請(專利權)人: | 清數健康醫療數據科學研究院(南京)有限公司;北京顥云信息科技股份有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70 |
| 代理公司: | 合肥華利知識產權代理事務所(普通合伙) 34170 | 代理人: | 蔣玉嬌 |
| 地址: | 211100 江蘇省南京市江寧區天元*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 海量 結構 醫學 數據 聚合 處理 辦法 | ||
本發明公開了一種海量多結構化醫學數據聚合處理辦法,具體涉及醫學數據處理技術領域,包括步驟一、采集數據;步驟二、數據分類;以將患有同種疾病的患者信息歸納到一起;步驟三、確定分析目標;步驟四、篩選樣本數據:確定研究變量;步驟五、構建數據處理模型:確定變量之間是否相關,以及相關方向;步驟六、挑選出相關的樣本數據,并記錄其相關方向,進行聚合歸納整理。本發明通過利用pearson積差相關系數來判斷不同種類的數據間是否存在相關關系,從而能夠挑選出與病癥關系最為密切的數據進行存儲,并且能夠將不存在相關關系的數據刪除,從而能夠節約存儲空間,還能夠方便醫療工作者查找關于該病癥的醫學數據。
技術領域
本發明實施例涉及醫學數據處理技術領域,具體涉及一種海量多結構化醫學數據聚合處理辦法。
背景技術
醫藥市場的持續繁榮直接助力行業發展,2007至今,我國醫藥市場的總產值增速持續攀升,成為全球醫藥行業最大的新興市場,逐年增加的研發投入為醫藥創新帶來強勁動力,所以隨著新藥研發市場的繁榮,醫學數據處理也邁向了新階段。在海量的醫學數據帶來各種優勢的同時,醫學數據隨之帶來的各種特性使得傳統的數據處理和數據分析方法及軟件捉襟見肘,問題多多。在大數據時代出現之前,受限于數據量的可獲得性和計算能力的有限性,傳統的數據管理和分析采用著不同的思路和流程。傳統上,對于問題的研究建立在假設的基礎上進行驗證,進而研究事物的相關因果性,希望能回答“為什么”。而在大數據時代,海量數據的涌現提供了從不同角度更細致更全面觀察研究數據的可能,從而打開了人們的好奇心,探索欲望,人們想知道到數據告訴了我什么,而不僅僅是我的猜想是否被數據驗證了。人們越來越多地用大數據挖掘各種感興趣的關聯、非關聯等相關性,然后再進一步比較,分析,歸納,研究。在醫學上,許多現象之間都有相互聯系,例如:身高與體重、體溫與脈搏、年齡與血壓、產前檢查與嬰兒體重、乙肝病毒與乙肝、胰島素與血糖水平、毒物劑量與動物的存活時間等。在這些有關系的現象中,它們之間聯系的程度和性質也各不相同,這里,體溫和脈搏的關系就比產前檢查與嬰兒體重之間的關系密切得多,而體重和身高的關系則介與二者之間。另外,可以說乙肝病毒感染是前因,得了乙肝是后果,乙肝病毒和乙肝之間是因果關系;但是,有的現象之間因果不清,只是伴隨關系,例如丈夫的身高和妻子的身高之間,就不能說有因果關系,因此在處理海量的醫學數據中,可以根據眾多數據中所存在的關系來對其進行處理。
而且隨著大數據的到來,各大醫療機構內所存儲的醫學數據也越來越多,而這些數據的存儲不僅會占據非常大的空間,也會為醫療工作者的研究查找帶來不便,因此需要發明一種海量多結構化醫學數據聚合處理辦法,使其能夠根據數據間存在的關系對眾多數據進行挑選和聚合,以保存最具有價值的醫學數據。
發明內容
為此,本發明實施例提供一種海量多結構化醫學數據聚合處理辦法,通過對利用pearson積差相關系數來判斷不同種類的數據間是否存在相關關系,從而能夠挑選出與病癥關系最為密切的數據進行存儲,并且能夠將不存在相關關系的數據刪除,從而能夠節約存儲空間,還能夠方便醫療工作者查找關于該病癥的醫學數據,以解決現有技術中由于存儲大量不必要的醫學數據導致的占據較大的內存以及浪費醫療工作人員查找時間的問題。
為了實現上述目的,本發明實施例提供如下技術方案:一種海量多結構化醫學數據聚合處理辦法,包括以下步驟:
步驟一、采集數據:
采用各大醫院中和各大制藥企業中的患者信息;
采取網絡調查問卷的方式收集信息;
步驟二、數據分類:
按照疾病的科目對采集到的數據進行第一次分類,將患有同種疾病的患者的信息歸納到一起,再根據每個科室下的具體疾病類型對患者的信息進行第二次分類,以將患有同種疾病的患者信息歸納到一起;
步驟三、確定分析目標;
步驟四、篩選樣本數據:確定研究變量;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清數健康醫療數據科學研究院(南京)有限公司;北京顥云信息科技股份有限公司,未經清數健康醫療數據科學研究院(南京)有限公司;北京顥云信息科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010989109.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





