[發明專利]確定個人信息查找結果可信度的機器學習系統和方法有效
| 申請號: | 201980053132.1 | 申請日: | 2019-08-13 |
| 公開(公告)號: | CN112639845B | 公開(公告)日: | 2023-04-04 |
| 發明(設計)人: | 約舒華·愛努卡;寧羅德·瓦克斯;艾亞爾·薩沙洛夫;艾特瑪爾·阿佩爾 | 申請(專利權)人: | 大號公司 |
| 主分類號: | G06F16/906 | 分類號: | G06F16/906;G06F18/2431;G06F21/62;G06N20/00 |
| 代理公司: | 北京乾成律師事務所 11949 | 代理人: | 宋獻濤 |
| 地址: | 美國紐約州紐*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 確定 個人信息 查找 結果 可信度 機器 學習 系統 方法 | ||
本發明公開了多種隱私管理平臺,可掃描任意數量的數據源,以使用戶對所存儲的個人信息、與存儲此類信息相關的風險和/或與此類信息相關的使用活動保持可見性。這些平臺可以將個人信息查找結果關聯到特定的數據主體,并且可以使用機器學習模型將查找結果分類為對應于特定個人信息屬性,以提供跨多個數據源的有索引清單。
相關申請的交叉引用
本申請主張2018年8月13日提交的題為“確定個人信息查找結果可信度的機器學習系統和方法”的第62/718,349號美國臨時專利申請的優先權,其全部內容被援引加入本申請中。
背景技術
概括地說,本發明涉及數據發現(discovery,也可譯為查找或開示)和保護。具體地說,本發明涉及用于對存儲在任意數量的數據源中的個人信息進行查找和分類的系統和方法。
在數字經濟中,維持客戶的肯定和信任需要確保他們的個人身份信息不會遭受到丟失、竊取和濫用的威脅。信息技術和互聯網的廣泛應用,導致不法分子更加容易通過破壞互聯網安全、網絡安全和網絡瀏覽器安全來竊取此類個人信息,從而使得收集和轉售個人信息成為一個有利可圖的市場。這些個人信息還可能被犯罪分子用來非法跟蹤或竊取一個人的身份信息,或用來幫助策劃犯罪行為。
如今,大多數機構在數據保護時面臨的主要挑戰是了解個人身份信息位于機構數據中心的什么位置。雖然有許多保護遺留數據(legacy?data)和預防數據丟失(“DLP”)的解決方案試圖解決這個問題,但這類應用程序通常采用基于正則表達式(regularexpressions)的分類算法。然而,這些解決方案尚未優化到能夠搜索給定機構客戶的具體個人信息,無法確定數據主體的身份,也無法找到相關聯的或有上下文的個人信息。
因此,市場需要能夠對遍布在機構的各種數據系統中存儲的敏感數據進行識別和分類的數據保護和客戶隱私管理系統。如果此類系統能夠提供有條理的個人信息清單(以屬性為索引),以便于管理數據風險和客戶隱私,那將是非常有益的。
發明內容
根據上述目標及其它目的,本發明描述了示例性的隱私管理平臺。所述平臺可具體化/實現為系統、計算機實現的方法、裝置和/或軟件應用。所述平臺可提供用于監控和分析隱私信息的隱私和數據保護客戶端應用程序。例如,平臺可被配置為能夠掃描某個機構的各種系統和應用程序,以使用戶對可以存儲在此類數據源中的任何個人信息、與存儲此類信息相關的任何相關風險和/或與此類信息相關的任何使用活動實現可見性。
隱私管理平臺的實施例可基于所存儲的和/或學習到的規則橫跨任意數量的本地系統和/或云端系統搜索個人信息。一旦查找到潛在的個人信息,平臺便可過濾出假陽性(false-positive,誤以為真)的個人信息查找結果(findings,亦可稱為“發現結果”),并通過在關聯處理過程(correlation?process,或相關過程)中創建個人信息記錄,將真陽性(true-positive,確實為真)的信息查找結果與特定的數據主體進行關聯(correlate,也叫相關)。因此,平臺可提供此類個人信息的清單(inventory),以使機構用于進行隱私影響因素評估。
在某些實施例中,平臺可以將樣本掃描技術和機器學習分類器結合起來使用,以提供統計有效的位置調查,同時還能顯著減少搜索時間和系統的運行壓力,這里所述統計有效的位置調查反映特定類型或屬性的個人信息存儲在掃描數據源中的什么位置。在一個這樣的實施例中,系統使用機器學習模型將已知包含個人信息屬性值的一個或多個身份數據源中的字段(即,列)與掃描數據源中的字段進行比較。更具體而言,機器學習模型可以分析與字段-字段比較結果(一個或多個身份數據源中的每個屬性字段與掃描數據源中的每個掃描字段的比較)相關聯的各種特征,以便確定身份數據源中的給定屬性字段是否包含了與掃描數據源中的給定掃描字段相同類型的個人信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于大號公司,未經大號公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980053132.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:具有慣性自動化系統的自動火器
- 下一篇:用于調色劑添加劑的復合顆粒





