[發明專利]一種用于數據庫分發保護的零水印方法有效
| 申請號: | 202010003811.2 | 申請日: | 2020-01-03 |
| 公開(公告)號: | CN111241576B | 公開(公告)日: | 2022-07-01 |
| 發明(設計)人: | 張迎周;沈茂林;邸云龍;孫玉欣;高戈;沈錫 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06F21/62 | 分類號: | G06F21/62;G06F21/16 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 張婷婷 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 數據庫 分發 保護 水印 方法 | ||
1.用于數據庫分發保護的零水印方法,其特征在于,包括在首次分發前對數據庫進行重組生成T-F表、對重要屬性選擇后進行零水印的生成、對泄露的數據庫先比對T-F表再進行零水印的提取檢測三個部分,其中:
對于首次分發前對數據庫進行重組生成T-F表,將原始數據庫按照不同的首次分發用戶進行重組,并對重組后的各表添加或者替換原來的主外鍵,從而在參照關系不變的情況下得到不同表結構的數據庫,然后對于每種重組后的數據庫表進行屬性記錄并存放在T-F表中,方便數據庫泄露之后的初步溯源;
所述對數據庫進行重組生成T-F表,其具體包括:
步驟1、獲取一組包含N個元組的原始數據庫表H,根據對不同用戶按照它的需求功能劃分到不同的數據庫表[h]中,對應的表重組為不同的表結構和個數K;
步驟2、根據重組后的表,按照各表屬性擁有情況,將其對應存儲到T-F表中;
步驟2.1、T-F表的表頭列為重組后的每張表的名稱{h1,h2,…},表頭行為原始的表中所有的屬性名稱{A1,A2,…},當某表中含有某屬性Ai時,就在對應的位置賦T,否則賦F;
對于重要屬性選擇后進行零水印的生成,通過隨機森林對特征重要性的評估來選取重要屬性參與特征提取,并使用屬性分類的思想對選取的屬性進行分類編號,通過提取屬性的分類編號與水印信息相加模10的方法生成水印密鑰,并將水印密鑰注冊到第三方權威機構CA中,其具體包括:
步驟3、對重要屬性進行選取和元組標記;
步驟3.1、使用隨機森林算法對特征重要性的評估來選取m個重要屬性{A1,A2,…Am};
步驟3.2、將選取出來的每個屬性與主鍵屬性組成新的關系表D(P,Ai),使用SHA-1哈希函數按照主鍵值和屬性值對元組進行標記,表示為RID=Hash(key1,r.P,r.Ai),key1為數據庫擁有者擁有的密鑰,其中r為數據庫元組,P為數據庫主鍵,r.P為主鍵為P的元組,r.Ai為屬性為Ai的元組;
步驟4、對選取的屬性進行分類并標記生成CID;
步驟4.1、對每個選取的屬性Ai,按照其屬性特點進行分類標記,若Ai可以分為n類,記為F1,F2,…Fn;
步驟4.2、通過分類算法F(RID,r.Ai)來標記生成每一個屬性值,對應的CID用1,2,...n來進行標記;
步驟5、生成水印密鑰key2
步驟5.1、對于滿足RID mod m=0的元組進行選取并存取為密鑰串1,然后記錄選取RID的CID值;
步驟5.2、根據生成的十進制水印信息的長度Lw,將總長度為Lf的分類特征數字串CID轉化成行,Lw列的二維數組;
步驟5.3、將要嵌入的水印信息轉化為十進制數字串與按RID提取出來的CID數字串進行相加,然后模10得到密鑰串2,最后將密鑰串1和密鑰串2一起存儲為水印密鑰key2;
步驟6、將key1和水印密鑰key2在第三方認證機構CA中完成注冊;
對泄露的數據庫先比對T-F表再進行零水印的提取檢測,首先,對于泄露的數據庫比對T-F表,初步確定首次分發的用戶單位,然后通過對泄露的數據庫進行零水印密鑰的提取,并與注冊在CA中的水印密鑰進行比對檢測,最終追蹤泄露的源頭,其具體包括:
步驟7、對于泄露的數據庫表進行檢測并追蹤首次分發用戶;
步驟7.1、對泄露的表分析屬性擁有情況,比對T-F表并初步定位首次分發的用戶;
步驟7.2、然后對泄露的數據庫表按照步驟3,步驟4和步驟5的方法進行零水印的提取,得到RID對應的序列CID,將該分發用戶在CA中注冊的key2取出,然后將key2中的密鑰2減去提取出的CID加10后再模10,得到個水印信息;
步驟7.3、接著,對這個水印信息使用多數選舉的方法,選取出出現次數最高的一組數字,將其轉化為二進制字符串W,然后和原來的數據庫水印碼字W′采用以下公式進行相關度檢測:
其中,W′,其表示為原來的數據庫水印碼字W′;W,其表示為二進制字符串;ei′,其表示為原數據庫水印碼字W′的第i位;ei″,其表示為二進制字符串W的第i位;N,其表示為水印碼字的總長度;
將計算出來的相似度與事先給定的閾值相比較來確定數據庫版權的歸屬,當相關度檢測結果超過這個閾值時,給出含有指定水印的結論,從而完成首次分發用戶的追蹤。
2.根據權利要求1中所述的用于數據庫分發保護的零水印方法,其特征在于,所述閾值定為5。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010003811.2/1.html,轉載請聲明來源鉆瓜專利網。





