[發明專利]一種醫學科研數據關鍵變量的加密方法及系統在審
| 申請號: | 202210532084.8 | 申請日: | 2022-05-09 |
| 公開(公告)號: | CN114896613A | 公開(公告)日: | 2022-08-12 |
| 發明(設計)人: | 余燦清;楊旭;呂筠;勞圣雄 | 申請(專利權)人: | 北京大學 |
| 主分類號: | G06F21/60 | 分類號: | G06F21/60;G16H10/60 |
| 代理公司: | 北京紀凱知識產權代理有限公司 11245 | 代理人: | 孫楠 |
| 地址: | 100871*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 醫學 科研 數據 關鍵 變量 加密 方法 系統 | ||
本發明涉及一種醫學科研數據關鍵變量的加密方法及系統,其包括:讀取數據行,獲取數據行中的所有變量;基于固定容器隨機選擇數據行,進而選取待加解密的變量,對選取的變量采用多線程并發進行加解密。本發明能解決醫學科研數據隱私數據的安全保密需求,同時保留密文的特征,支持將密文納入研究作為分類區分。本發明可以在醫學數據處理技術領域中應用。
技術領域
本發明涉及一種醫學數據處理技術領域,特別是關于一種醫學科研數據關鍵變量的加密方法及系統。
背景技術
醫學科研數據收集聚焦于與人類疾病或健康相關問題的信息,其數據量較大,覆蓋內容極其廣泛,既包括個人基本信息、日常行為生活方式、體格檢查和各種檢測結果。因此,關鍵和隱私信息的保密是醫學科研的使用中最為關鍵的倫理問題。
目前,處理這些關鍵信息最為簡單和常規的方法是直接刪除這些關鍵變量,不用于分析和利用,然而這種簡單粗暴的方法也存在缺陷。醫學科研數據的利用通常需要多次反復利用,或者通過這些關鍵量鏈接到更多的數據。因此,傳統方法無法滿足上述要求。
發明內容
針對上述問題,本發明的目的是提供一種醫學科研數據關鍵變量的加密方法及系統,其能解決醫學科研數據隱私數據的安全保密需求,同時保留密文的特征,支持將密文納入研究作為分類區分。
為實現上述目的,本發明采取以下技術方案:一種醫學科研數據關鍵變量的加密方法,其包括:讀取數據行,獲取數據行中的所有變量;基于固定容器隨機選擇數據行,進而選取待加解密的變量,對選取的變量采用多線程并發進行加解密。
進一步,所述讀取數據行中,數據的格式為csv、txt、dta、sas7bdat。
進一步,所述基于固定容器隨機選擇數據行,包括:
在數據加密開始后先讀取一部分數據到基于內存的固定大小的容器中,直至寫滿容器;
在每讀到新的一行數據前,先從當前的容器隨機取一行數據輸出到目標文件,再將讀取到的數據存入容器;寫到目標文件中的每一行數據都是從容器中隨機選取的。
進一步,所述對選取的變量采用多線程并發進行加解密中,需設置密鑰,所述密鑰的生成方法包括:
將用戶輸入的申請編號與本地操作系統生成的鹽進行混合,生成第一中間文本;
對所述第一中間文本進行Base64編碼,生成第二中間文本;
將所述第二中間文本進行MD5散列得到第三中間文本,將所述第三中間文本進行HEX摘要處理,將字節數組轉為16位得到參與加解密運算的密鑰。
進一步,所述將用戶輸入的申請編號與本地操作系統生成的鹽進行混合,包括:
在所述本地操作系統生成種子文件,該種子文件與操作系統用戶進行綁定,所述種子文件的內容為所述申請編號轉換過程中的所述鹽。
進一步,所述加解密采用AES-192算法。
進一步,所述對選取的變量采用多線程并發進行加解密,包括:
開啟兩個線程,第一線程用于從數據行讀取數據,第二線程用于將加密結果寫入數據文件;
同時開啟若干個第三線程進行并發加解密處理,若干所述第三線程并行地將輸入數據行進行變量提取、對選定的變量進行加解密處理,處理后重新組裝加密的變量和未加密的變量作為數據行,將組合后的數據行發送給用于寫文件的所述第二線程,所述第二線程調用操作系統的追加寫文件接口,即將處理完成后的數據行追加寫入數據文件中。
一種醫學科研數據關鍵變量的加密系統,其包括:數據讀取模塊,讀取數據行,獲取數據行中的所有變量;加解密模塊,基于固定容器隨機選擇數據行,進而選取待加解密的變量,對選取的變量采用多線程并發進行加解密。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京大學,未經北京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210532084.8/2.html,轉載請聲明來源鉆瓜專利網。
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





