[發明專利]針對數據庫表、文本文件和數據饋送的變化指紋鑒定在審
| 申請號: | 201780021979.2 | 申請日: | 2017-02-08 |
| 公開(公告)號: | CN109416717A | 公開(公告)日: | 2019-03-01 |
| 發明(設計)人: | 亞瑟·科爾曼;馬丁·羅斯;梁芷苓·克里斯蒂娜 | 申請(專利權)人: | 利弗萊姆有限公司 |
| 主分類號: | G06F21/55 | 分類號: | G06F21/55;G06F21/57;G06F21/62 |
| 代理公司: | 上海專利商標事務所有限公司 31100 | 代理人: | 亓云 |
| 地址: | 美國加利*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文本文件 創建文件 數據庫表 數據饋送 指紋鑒定 時間幀 單個對象 年齡數據 文件創建 元數據 被盜 刪除 創建 應用 | ||
變化指紋鑒定被應用于文本文件、數據庫表或數據饋送,以確定其中生成所標識的“野生文件”的時間幀,即使在其文件創建元數據丟失時。數據中的每行包含關于單個對象的信息。數據中的至少一列在創建文件時包含每個對象的年齡。該年齡數據可被用于確定創建文件的日期,諸如通過使用識別處理或通過查看基于年齡從文件中添加或刪除的數據。通過標識其中創建野生文件的時間幀,數據擁有者可極大地減少確定野生文件是否包含被盜數據所需的計算負擔,因為它極大地減少了必須與野生文件相比的文件世界。
技術領域
本發明解決了使用基于內容的零水印技術的數據文件的數據隱私和取證分析的問題,以確定創建文件的日期。
背景技術
數據的擁有者(每個都是“數據提供者”)通常將他們的數據給予、租借或出售給據信以合法方式處理該數據的個人或組織(“可信第三方”或“TTP”)。TTP有義務遵守合同要求或數據處理規則,諸如由地方、州或聯邦政府制定的金融服務或隱私法律中的條例B。該數據通常作為一系列數據庫表(.sql)、文本文件(.csv、.txt或其它格式)、或作為實時數據饋送(例如,XML或JSON)來被傳送。盡管如此,數據提供者的數據可泄漏(所泄漏的文件被定義為“被泄漏的子集”)到那些或非法地故意或無意使用該數據的其他人(“壞角色”)的手中。這可能因為以下原因而發生,例如,TTP故意發布數據并且其本身就是壞角色;TTP的員工故意或意外地發布數據;或實際數據提供者本身的員工故意或無意地泄露數據。一旦數據提供者的數據泄漏,它可被許多壞角色按各種方式操縱:元素可被更改,它可以與來自其他數據提供者的數據合并,或者它可被分成子集或重新排列,以及其他類型的操作。這使得數據提供者難以在法庭上認清數據是自己的,標識對泄漏數據負責的一方,并追回損失的收入。
如共同未決的國際專利申請號PCT/US2016/068418中所公開的,申請人已經開發了用于對數據集打上水印以標識泄漏的子集并標識哪個TTP或哪些TTP是壞角色(“罪責分配”)的硬件和軟件中系統和方法。該系統和方法解決了兩個問題:出站處理和入站處理。出站處理指將唯一數據與來自數據提供者的每個出站數據子集(也稱為“水印”或“指紋”,這取決于所使用的技術)的關聯,以便任何泄漏子集中包含的數據(即使以某種方式改變)仍然可被標識為來自數據提供者和該特定文件。入站處理允許數據提供者隨后跟蹤數據流回到特定的TTP,從而可以分配它是泄漏子集的可能源的概率,并以可在法院強制執行的方式確定其罪責。這需要取得從第三方獲取的數據文件(“野生文件(Wild File)”)的能力,該數據文件實際上可以包含數據提供者的數據,不管第三方是否已知為壞角色,并且以能被識別為來自特定數據文件、來自特定TTP的方式來處理它。在作出此確定時,入站處理的問題是,數據提供者(或其代理,諸如第三方服務)必須將野生文件中包含的數據與來自特定TTP的匹配泄漏子集匹配。在提供數據指紋鑒定和罪責分配的商業系統中,每個TTP可能在多年期間每月接收數百個文件,并且可能有數千個TTP。在數百萬文件的世界中,在當今的技術下,通過其中對每個文件進行比較的蠻力方法與單個文件進行匹配將是計算上非常昂貴的(如果不是不可能的話)。
示例將給這個問題帶來一種規模感。假設數據提供者一年運送200,000文件超過10年,這代表2,000,000個總文件出貨(“文件世界”)。同樣假設花一個小時來確定特定文件是否是特定野生文件中的泄漏數據的源。如果需要搜索整個文件世界,則將花費2,000,000小時,這等于228年。可進一步注意到,該示例忽略任何數據提供者可能同時處理從多個源獲取的多個野生文件的事實。花費這么長的解決方案顯然是無用的。
那么隨后可以看到以下的系統和方法將是非常需要的:允許數據提供者在合理的時間段內確定野生文件是否與特定的泄漏子集相匹配,使得進行數據指紋鑒定值得首先做。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于利弗萊姆有限公司,未經利弗萊姆有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201780021979.2/2.html,轉載請聲明來源鉆瓜專利網。





