[發明專利]一種關聯規則的確定方法及裝置在審
| 申請號: | 201711089175.4 | 申請日: | 2017-11-08 |
| 公開(公告)號: | CN107832416A | 公開(公告)日: | 2018-03-23 |
| 發明(設計)人: | 王樹崢 | 申請(專利權)人: | 山東浪潮云服務信息科技有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 濟南信達專利事務所有限公司37100 | 代理人: | 李世喆 |
| 地址: | 250100 山東省濟南市高*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 關聯 規則 確定 方法 裝置 | ||
技術領域
本發明涉及計算機技術領域,特別涉及一種關聯規則的確定方法及裝置。
背景技術
關聯規則是反映一個事物與其他事物之間的相互依存性和關聯性的規則,其在金融和電子商務等多個領域具有重要作用。目前,人們已開發出多種算法對關聯規則進行挖掘,例如Apriori算法和FP-樹頻集算法等。
在利用Apriori算法挖掘關聯規則時,一般先從數據庫的眾多數據中確定出頻繁項集,即支持度不低于預設閾值的數據項集合,再從頻繁項集中確定置信度不低于預設閾值的數據項,則確定出的支持度和置信度分別大于預設閾值的數據項,即為具有關聯的數據項。
在此過程中可能會產生僅符合支持度或置信度要求的候選數據集,計算時需反復迭代候選數據集中的數據項,迭代時需掃描整個數據庫,而數據庫中的數據量較大,掃描過程耗費的時間較多,導致確定關聯規則的效率較低。
發明內容
本發明實施例提供了一種關聯規則的確定方法及裝置,能提高關聯規則的確定效率。
第一方面,本發明實施例提供了一種關聯規則的確定方法,包括:
構建輔助表,所述輔助表中包括:至少兩個待處理數據分別對應的標識信息和字段長度,以及每一個所述待處理數據對應的標識信息與所述至少兩個待處理數據中的至少一個其他待處理數據對應的標識信息構成的數據組合;
針對每一個所述數據組合,均執行:根據每一個所述數據組合對應的待處理數據的字段長度,確定所述數據組合對應的支持度;
確定所述支持度是否大于預設的支持度閾值,如果是,將所述數據組合作為頻繁項集,否則,根據所述數據組合對應的標識信息,從所述輔助表中移除所述數據組合;
確定所述頻繁項集對應的置信度,并確定所述置信度是否大于預設的置信閾值,如果是,確定所述頻繁項集對應的各個所述待處理數據之間存在關聯。
優選地,
當確定出所述數據組合的支持度不大于所述支持度閾值時,所述根據所述數據組合對應的標識信息,從所述輔助表中移除所述數據組合,包括:
根據所述數據組合中的各個所述標識信息,確定與所述數據組合對應的目標組合;其中,所述目標組合包括所述數據組合中的每一個所述標識信息;
將確定出的所述目標組合和所述數據組合從所述輔助表中進行移除。
優選地,
所述構建輔助表,包括:
確定空閑內存空間;
在確定出的空閑內存空間中構建所述輔助表。
優選地,
所述根據每一個所述數據組合對應的待處理數據的字段長度,確定所述數據組合對應的支持度,包括:
利用以下計算公式,計算所述數據組合對應的支持度;
其中,M表征所述數據組合對應的支持度;bi表征所述數據組合中的第i個待處理數據對應的字段長度;n表征各個所述待處理數據的總數量;ai表征第i個待處理數據對應的字段長度。
優選地,
所述確定所述頻繁項集對應的置信度,包括:
從所述頻繁項集中確定目標待處理數據;
根據所述目標待處理數據對應的字段長度,利用下述計算公式,計算所述頻繁項集對應的置信度;
其中,N表征所述頻繁項集對應的置信度,bi表征所述頻繁項集中的第i 個待處理數據對應的字段長度,n表征所述目標待處理數據對應的字段長度。
第二方面,本發明實施例提供了一種關聯規則的確定裝置,包括:構建單元、支持度確定單元和關聯規則確定單元;其中,
所述構建單元,用于構建輔助表,所述輔助表中包括:至少兩個待處理數據分別對應的標識信息和字段長度,以及每一個所述待處理數據對應的標識信息與所述至少兩個待處理數據中的至少一個其他待處理數據對應的標識信息構成的數據組合;
所述支持度確定單元,用于針對每一個所述數據組合,均執行:根據每一個所述數據組合對應的待處理數據的字段長度,確定所述數據組合對應的支持度;并確定所述支持度是否大于預設的支持度閾值,如果是,將所述數據組合作為頻繁項集,否則,根據所述數據組合對應的標識信息,從所述輔助表中移除所述數據組合;
所述關聯規則確定單元,用于確定所述頻繁項集對應的置信度,并確定所述置信度是否大于預設的置信閾值,如果是,確定所述頻繁項集對應的各個所述待處理數據之間存在關聯。
優選地,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東浪潮云服務信息科技有限公司,未經山東浪潮云服務信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711089175.4/2.html,轉載請聲明來源鉆瓜專利網。





