[發(fā)明專利]一種基于布爾矩陣和二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法在審
| 申請(qǐng)?zhí)枺?/td> | 202111113072.3 | 申請(qǐng)日: | 2021-09-23 |
| 公開(公告)號(hào): | CN113806424A | 公開(公告)日: | 2021-12-17 |
| 發(fā)明(設(shè)計(jì))人: | 吳海玲;裴樹軍;張宇 | 申請(qǐng)(專利權(quán))人: | 哈爾濱理工大學(xué) |
| 主分類號(hào): | G06F16/2458 | 分類號(hào): | G06F16/2458;G06F16/22 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150080 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 布爾 矩陣 二進(jìn)制 編碼 改進(jìn) 關(guān)聯(lián) 規(guī)則 apriori 算法 | ||
本發(fā)明提出一種基于布爾矩陣與二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法。通過用布爾矩陣存儲(chǔ)數(shù)據(jù)庫的方式,使得整個(gè)算法對(duì)數(shù)據(jù)庫只進(jìn)行一次掃描操作,然后利用二進(jìn)制編碼之間的“與”運(yùn)算,獲取項(xiàng)集的事務(wù)支持度,同時(shí)增加了非頻繁項(xiàng)集的記錄表,對(duì)候選項(xiàng)集提前剪枝,大大提高了算法的效率。
技術(shù)領(lǐng)域
本發(fā)明涉及一個(gè)基于布爾矩陣和二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法,屬于數(shù)據(jù)挖掘領(lǐng)域。
背景技術(shù)
Apriori算法是最經(jīng)典的關(guān)聯(lián)規(guī)則挖掘算法之一,其核心思想就是利用連接產(chǎn)生候選項(xiàng)集,同時(shí)利用最小支持度對(duì)候選項(xiàng)集進(jìn)行剪枝,最終生成頻繁項(xiàng)集,但是隨著數(shù)據(jù)爆發(fā)性的增長,傳統(tǒng)的Aprior算法需要多次掃描數(shù)據(jù)庫并且容易產(chǎn)生大量的候選項(xiàng)集,使得算法效率低下。
因此本發(fā)明提出一種基于布爾矩陣與二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法,通過用布爾矩陣存儲(chǔ)數(shù)據(jù)庫的方式,使得整個(gè)算法對(duì)數(shù)據(jù)庫只進(jìn)行一次掃描操作,然后利用二進(jìn)制編碼之間的“與”運(yùn)算獲取項(xiàng)集的事務(wù)支持度,同時(shí)增加了非頻繁項(xiàng)集的記錄表,對(duì)候選項(xiàng)集提前剪枝,大大提高了算法的效率。
發(fā)明內(nèi)容
為了解決Apriori算法需要多次掃描數(shù)據(jù)庫與產(chǎn)生大量候選項(xiàng)集的缺點(diǎn),本發(fā)明提出了一種基于布爾矩陣與二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法。
為實(shí)現(xiàn)上述目的,本發(fā)明提供了如下技術(shù)方案:
1.一種基于布爾矩陣和二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法,其特征在于,該方法包括以下步驟:
(1)掃描數(shù)據(jù)庫,生成布爾矩陣,獲得頻繁1-項(xiàng)集;
(2)壓縮布爾矩陣;
(3)提前預(yù)剪枝,同時(shí)建立非頻繁項(xiàng)集的記錄表;
(4)建立輔助表;
(5)更新非頻繁項(xiàng)集記錄表;
(6)縮減算法流程;
(7)壓縮布爾矩陣,預(yù)剪枝,同時(shí)返回到步驟4,直到頻繁k-項(xiàng)集個(gè)數(shù)小于k+1時(shí),迭代結(jié)束。
2.根據(jù)權(quán)利要求1所述的一種基于布爾矩陣和二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法,其特征在于,所述步驟(1)中,掃描數(shù)據(jù)庫,生成布爾矩陣,獲得頻繁1-項(xiàng)集,具體步驟為:
步驟1-1首先掃描數(shù)據(jù)庫,用布爾矩陣來存儲(chǔ),行表示事務(wù)id,列表示項(xiàng),其中矩陣中的aij的可能取值為0或1,取值為1就代表此項(xiàng)目存在于事務(wù)中,0就代表不存在。計(jì)算各個(gè)事務(wù)的項(xiàng)目數(shù),并按這個(gè)值對(duì)矩陣進(jìn)行降序排列,在矩陣最后增加2列,第1列n,n用來記錄每行中“1”的個(gè)數(shù),第2列w,w用于將事務(wù)數(shù)據(jù)庫中重復(fù)出現(xiàn)的事務(wù)壓縮為1行,從而保證矩陣存儲(chǔ)中每1條事務(wù)信息都不重復(fù),在矩陣最后增加1行s,s用來記錄每列的和;
步驟1-2根據(jù)布爾矩陣,獲得頻繁1-項(xiàng)集。
3.根據(jù)權(quán)利要求1所述的一種基于布爾矩陣和二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法,其特征在于,所述步驟(2)中,計(jì)算各個(gè)事務(wù)的項(xiàng)目數(shù),并按這個(gè)值對(duì)矩陣進(jìn)行降序排列,將非頻繁1-項(xiàng)集所在的列刪除,重新計(jì)算矩陣列n的值,按降序重新排列矩陣,同時(shí)在求頻繁k-項(xiàng)集(k≥2)時(shí),將矩陣中的事務(wù)數(shù)小于k的行直接刪除,重新計(jì)算矩陣中各列的值并重新排列矩陣。
4.根據(jù)權(quán)利要求1所述的一種基于布爾矩陣和二進(jìn)制編碼改進(jìn)的關(guān)聯(lián)規(guī)則Apriori算法,其特征在于,所述步驟(3)中,提前預(yù)剪枝,同時(shí)建立非頻繁項(xiàng)集的記錄表,具體步驟為:
步驟3-1利用“若能生成頻繁k-項(xiàng)集(k≥2),則頻繁(k-1)-項(xiàng)集中每個(gè)項(xiàng)的個(gè)數(shù)不能小于k-1”的性質(zhì),對(duì)候選k-項(xiàng)集(k≥2)進(jìn)行剪枝;
步驟3-2建立非頻繁項(xiàng)集的記錄表;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于哈爾濱理工大學(xué),未經(jīng)哈爾濱理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111113072.3/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 將過程控制系統(tǒng)中梯形邏輯轉(zhuǎn)換為布爾邏輯的方法和系統(tǒng)
- 布爾登管式壓力計(jì)
- 基于增量式高次布爾能量最小化的視頻前后景分割方法
- 一種數(shù)據(jù)處理方法、裝置、存儲(chǔ)介質(zhì)及處理器
- 一種聯(lián)鎖布爾邏輯的優(yōu)化方法
- 建筑外輪廓模型生成方法、系統(tǒng)、裝置及可讀存儲(chǔ)介質(zhì)
- 一種搜索S盒的最少硬件實(shí)現(xiàn)門數(shù)的方法和S盒電路結(jié)構(gòu)
- 圖計(jì)算的布爾型變量存儲(chǔ)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于混合布爾網(wǎng)絡(luò)的多功能物理不可克隆函數(shù)裝置
- 一種多層布爾網(wǎng)絡(luò)的模型辨識(shí)方法及系統(tǒng)
- 在集成電路器件中求解線性矩陣
- 矩陣計(jì)算裝置、矩陣計(jì)算方法
- 一種數(shù)據(jù)聚類的方法、裝置及Spark大數(shù)據(jù)平臺(tái)
- 適用于黑白圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 適用于灰度圖片的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法以及訓(xùn)練方法
- 矩陣
- 矩陣/密鑰生成裝置、矩陣/密鑰生成系統(tǒng)、矩陣結(jié)合裝置、矩陣/密鑰生成方法、程序
- 矩陣運(yùn)算電路、矩陣運(yùn)算裝置及矩陣運(yùn)算方法
- 矩陣乘法計(jì)算方法和裝置
- 數(shù)據(jù)讀取方法、裝置、介質(zhì)和計(jì)算設(shè)備
- 打印控制裝置和打印控制方法
- 用于軟件加密的計(jì)算機(jī)系統(tǒng)及方法
- 二進(jìn)制碼驗(yàn)證服務(wù)
- 計(jì)算機(jī)二進(jìn)制教學(xué)工具
- 一種數(shù)據(jù)刪除方法、設(shè)備及平臺(tái)
- 長度為八位二進(jìn)制的一維碼制
- 圖像量化參數(shù)解碼方法
- 通過二進(jìn)制和存儲(chǔ)器多樣性進(jìn)行混淆的系統(tǒng)和方法
- 通過參數(shù)化概率估計(jì)有限狀態(tài)機(jī)進(jìn)行二進(jìn)制算術(shù)譯碼
- 二進(jìn)制至格雷轉(zhuǎn)換電路和FIFO存儲(chǔ)器





