[發明專利]基于隱私保護的基因相似度計算方法及基因信息獲取方法有效
| 申請號: | 202010312340.3 | 申請日: | 2020-04-20 |
| 公開(公告)號: | CN111540409B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 汪潔;張由甲 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B50/40;G16H50/70 |
| 代理公司: | 長沙永星專利商標事務所(普通合伙) 43001 | 代理人: | 周詠;米中業 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 隱私 保護 基因 相似 計算方法 信息 獲取 方法 | ||
本發明公開了一種基于隱私保護的基因相似度計算方法,包括數據庫端和用戶端分別進行初始化;用戶端和數據庫端對各自的基因序列進行字符填充;用戶端得到用戶基因移動序列;數據庫端得到存儲基因移動序列;用戶端得到用戶基因移動序列向量;數據庫端得到存儲基因移動序列向量;用戶端對用戶基因移動序列向量加密并發送數據庫端;數據庫端解密并計算存儲基因移動序列向量與存儲基因移動序列向量之間的序列相似度并得到最終的基因相似度計算結果。本發明還公開了包括所述基于隱私保護的基因相似度計算方法的基因信息獲取方法。本發明實現了對用戶基因序列與數據庫中基因序列的相似度計算、比對和保密傳輸,而且可靠性高、實用性、保密性和準確性好。
技術領域
本發明屬于生物信息技術領域,具體涉及一種基于隱私保護的基因相似度計算方法及基因信息獲取方法。
背景技術
人類的全部生物信息可以由基因數據反映出來,并存儲在人類的脫氧核糖核酸(deoxyribonucleic?acid,簡稱DNA)序列之中。生物的遺傳和變異都與DNA密切相關。如今基因測序技術飛速發展,基因測序的成本正在逐漸降低;基因數據在很多領域有著廣泛的應用。
在醫學上,為了給病人提供最佳的治療方案,醫生需要將病人的DNA與遠程基因組數據庫進行比對。數據庫中存儲個體基因組序列,每個序列都標有此人的醫療狀況(Medical?Conditions)。醫生需要在數據庫中找到與病人基因組序列最相似的少數個體,并了解這些個體的醫療狀況。這種在數據庫中的查詢稱為相似病人查詢(Similar?PatientQueries,簡稱SPQ)。SPQ有利于確定疾病背后的基因突變,也有利于避免無法治愈疾病的痛苦治療方案,提供更準確的疾病預測和指導。
人類有99.9%以上的DNA是相同的,剩下部分由于遺傳變異而不同。最常見的變異只涉及單個核苷酸,這種變異稱為單核苷酸多態性(single?nucleotide?polymorphism,簡稱SNP)。在基因組序列中只需30~80個獨立的SNP位點就可以唯一重識別個體,并含有該個體的隱私敏感信息,例如,載脂蛋白E(apolipoprotein?E)基因的兩個SNP(rs429358和rs7412)會增加患阿爾茨海默病(Alzheimer’s?disease)的風險。
現階段,信息技術快速發展,醫生能夠較為輕松的將病人的基因組數據與遠程數據庫中的若干個體基因組數據進行比對,從而獲取相應的相似基因組的相關數據。但是,隨著信息技術的發展,病人基因組數據的發送和接收,以及數據庫中基因組數據的傳輸等過程,極易受到攻擊,從而導致數據的泄露,緊接著可能會造成嚴重的隱私泄露,并給社會帶來重要的影響。
為了安全地使用數據庫中的人類基因數據,需要隱私保護技術保證基因數據的隱私性。目前主要有三種保護基因隱私的思路:基于加密算法的方法、基于差分隱私的方法和基于安全計算協議的方法。
為了解決微生物測序的隱私問題,Wagner等人使用安全計算實現宏基因組分析。Baldi等人提出的PSI協議和Brudno等人提出的PSIS協議是基于海明距離(hammingdistance)近似計算基因數據的相似性。雖然保護了基因數據的隱私性,但只能處理較短的基因組片段。Wang等人通過基因編輯距離(edit?distance)近似算法和Private?SetDifference?Size協議提出了隱私編輯距離協議。但在一些情況下的計算結果并不理想,因為序列的字符排列方式會影響到單字符編輯操作(single-character?edits)集合的計算結果,使得相似度計算的偏差,從而導致相似病人查詢結果不準確。
發明內容
本發明的目的之一在于提供一種可靠性高、實用性好、保密性好且準確性好的基于隱私保護的基因相似度計算方法。
本發明的目的之二在于提供一種包括了所述基于隱私保護的基因相似度計算方法的基因信息獲取方法。
本發明提供的這種基于隱私保護的基因相似度計算方法,包括如下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010312340.3/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:支付異常處理方法及系統
- 下一篇:一種離子化裝置及其應用





