[發(fā)明專利]增量式隱私保護的頻繁模式挖掘方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 201810588127.8 | 申請日: | 2018-06-08 |
| 公開(公告)號: | CN109062927A | 公開(公告)日: | 2018-12-21 |
| 發(fā)明(設計)人: | 尚凌輝;陳鑫;葉淑陽 | 申請(專利權(quán))人: | 浙江捷尚人工智能研究發(fā)展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F21/62 |
| 代理公司: | 廣州市越秀區(qū)哲力專利商標事務所(普通合伙) 44288 | 代理人: | 胡擁軍;糜婧 |
| 地址: | 310000 浙江省杭州市余杭區(qū)五常*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù)庫 頻繁項集 頻繁模式 隱私保護 加權(quán)系數(shù) 增量式 支持度 挖掘 生成算法 挖掘結(jié)果 挖掘算法 增量更新 數(shù)據(jù)量 索引量 合并 引入 | ||
1.一種增量式隱私保護的頻繁模式挖掘方法,其特征在于,包括:
設定步驟,設定原數(shù)據(jù)庫的閾值、新增數(shù)據(jù)庫的閾值、新數(shù)據(jù)庫的閾值;所述新數(shù)據(jù)庫為原數(shù)據(jù)庫增加了新增數(shù)據(jù)庫后形成的數(shù)據(jù)庫;
第一挖掘步驟,根據(jù)原數(shù)據(jù)庫的閾值對原數(shù)據(jù)庫進行頻繁模式挖掘,獲取原數(shù)據(jù)庫的頻繁項集、各頻繁項及其支持度;
第二挖掘步驟,根據(jù)新增數(shù)據(jù)庫的閾值對新增數(shù)據(jù)庫進行頻繁模式挖掘,獲取新增數(shù)據(jù)庫的頻繁項集、各頻繁項及其支持度;
系數(shù)確定步驟,根據(jù)原數(shù)據(jù)庫的數(shù)據(jù)量和索引量、新增數(shù)據(jù)庫的數(shù)據(jù)量和索引量,確定原數(shù)據(jù)庫的加權(quán)系數(shù)和新增數(shù)據(jù)庫的加權(quán)系數(shù);
合并步驟,對原數(shù)據(jù)庫的頻繁項集和新增數(shù)據(jù)庫的頻繁項集進行同類項合并,得到新數(shù)據(jù)庫的確認頻繁項集和待確認頻繁項集;
確認步驟,將確認頻繁項集中的頻繁項列入新數(shù)據(jù)庫的頻繁項集;對于待確認頻繁項集中的待確認頻繁項,依次確認每個待確認頻繁項是否列入新數(shù)據(jù)庫的頻繁項集;獲取新數(shù)據(jù)庫的頻繁項集中每個頻繁項在新數(shù)據(jù)庫的支持度。
2.根據(jù)權(quán)利要求1所述的增量式隱私保護的頻繁模式挖掘方法,其特征在于,所述合并步驟,具體為:
將原數(shù)據(jù)庫的頻繁項集中的頻繁項和新增數(shù)據(jù)庫的頻繁項集中的頻繁項作為待確認頻繁項;
如果某待確認頻繁項同時出現(xiàn)在原數(shù)據(jù)庫和新增數(shù)據(jù)庫,則將該待確認頻繁項列入新數(shù)據(jù)庫的確認頻繁項集;
如果某待確認頻繁項只出現(xiàn)在原數(shù)據(jù)庫或者新增數(shù)據(jù)庫,則將該待確認頻繁項列入新數(shù)據(jù)庫的待確認頻繁項集。
3.根據(jù)權(quán)利要求2所述的增量式隱私保護的頻繁模式挖掘方法,其特征在于,所述確認步驟,具體為:
將確認頻繁項集中的頻繁項列入新數(shù)據(jù)庫的頻繁項集;且新數(shù)據(jù)庫中該頻繁項的支持度=原數(shù)據(jù)庫中該頻繁項的支持度×原數(shù)據(jù)庫的加權(quán)系數(shù)+新增數(shù)據(jù)庫中該頻繁項的支持度×新增數(shù)據(jù)庫的加權(quán)系數(shù);
對于待確認頻繁項集中的待確認頻繁項,
如果某待確認頻繁項只出現(xiàn)在原數(shù)據(jù)庫,則新數(shù)據(jù)庫中該待確認頻繁項的支持度=原數(shù)據(jù)庫中該頻繁項的支持度×原數(shù)據(jù)庫的加權(quán)系數(shù),比對新數(shù)據(jù)庫中該待確認頻繁項的支持度是否達到新數(shù)據(jù)庫的閾值,是則將該待確認頻繁項列入新數(shù)據(jù)庫的頻繁項集;
如果某待確認頻繁項只出現(xiàn)在新增數(shù)據(jù)庫,則新數(shù)據(jù)庫中該待確認頻繁項的支持度=新增數(shù)據(jù)庫中該頻繁項的支持度×新增數(shù)據(jù)庫的加權(quán)系數(shù),比對新數(shù)據(jù)庫中該待確認頻繁項的支持度是否達到新數(shù)據(jù)庫的閾值,是則將該待確認頻繁項列入新數(shù)據(jù)庫的頻繁項集。
4.根據(jù)權(quán)利要求1或2所述的增量式隱私保護的頻繁模式挖掘方法,其特征在于,所述原數(shù)據(jù)庫的閾值、新增數(shù)據(jù)庫的閾值、新數(shù)據(jù)庫的閾值均為0.25。
5.根據(jù)權(quán)利要求1或2所述的增量式隱私保護的頻繁模式挖掘方法,其特征在于,原數(shù)據(jù)庫的加權(quán)系數(shù)+新增數(shù)據(jù)庫的加權(quán)系數(shù)=1。
6.一種增量式隱私保護的頻繁模式挖掘系統(tǒng),其特征在于,包括:
設定模塊,用于設定原數(shù)據(jù)庫的閾值、新增數(shù)據(jù)庫的閾值、新數(shù)據(jù)庫的閾值;所述新數(shù)據(jù)庫為原數(shù)據(jù)庫增加了新增數(shù)據(jù)庫后形成的數(shù)據(jù)庫;
第一挖掘模塊,用于根據(jù)原數(shù)據(jù)庫的閾值對原數(shù)據(jù)庫進行頻繁模式挖掘,獲取原數(shù)據(jù)庫的頻繁項集、各頻繁項及其支持度;
第二挖掘模塊,用于根據(jù)新增數(shù)據(jù)庫的閾值對新增數(shù)據(jù)庫進行頻繁模式挖掘,獲取新增數(shù)據(jù)庫的頻繁項集、各頻繁項及其支持度;
系數(shù)確定模塊,用于根據(jù)原數(shù)據(jù)庫的數(shù)據(jù)量和索引量、新增數(shù)據(jù)庫的數(shù)據(jù)量和索引量,確定原數(shù)據(jù)庫的加權(quán)系數(shù)和新增數(shù)據(jù)庫的加權(quán)系數(shù);
合并模塊,用于對原數(shù)據(jù)庫的頻繁項集和新增數(shù)據(jù)庫的頻繁項集進行同類項合并,得到新數(shù)據(jù)庫的確認頻繁項集和待確認頻繁項集;
確認模塊,用于將確認頻繁項集中的頻繁項列入新數(shù)據(jù)庫的頻繁項集;對于待確認頻繁項集中的待確認頻繁項,依次確認每個待確認頻繁項是否列入新數(shù)據(jù)庫的頻繁項集;獲取新數(shù)據(jù)庫的頻繁項集中每個頻繁項在新數(shù)據(jù)庫的支持度。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江捷尚人工智能研究發(fā)展有限公司,未經(jīng)浙江捷尚人工智能研究發(fā)展有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810588127.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)庫
- 數(shù)據(jù)庫管理系統(tǒng)及數(shù)據(jù)庫
- 數(shù)據(jù)庫構(gòu)筑裝置、數(shù)據(jù)庫檢索裝置、數(shù)據(jù)庫裝置、數(shù)據(jù)庫構(gòu)筑方法、以及數(shù)據(jù)庫檢索方法
- 數(shù)據(jù)庫和數(shù)據(jù)庫處理方法
- 數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)庫更新方法、數(shù)據(jù)庫以及數(shù)據(jù)庫更新程序
- 容器數(shù)據(jù)庫
- 數(shù)據(jù)庫同步方法及數(shù)據(jù)庫
- 一種MongoDB數(shù)據(jù)庫對象復制延遲監(jiān)控方法和裝置
- 數(shù)據(jù)分布式存儲方法、裝置、電子設備及存儲介質(zhì)
- 數(shù)據(jù)庫語句執(zhí)行方法及裝置





