[發(fā)明專利]一種基于FP-樹的時空數(shù)據(jù)挖掘分析方法在審
| 申請?zhí)枺?/td> | 201810877226.8 | 申請日: | 2018-08-03 |
| 公開(公告)號: | CN109344150A | 公開(公告)日: | 2019-02-15 |
| 發(fā)明(設(shè)計)人: | 宋耀蓮;田榆杰;龍華;王慧東;徐文林;武雙新 | 申請(專利權(quán))人: | 昆明理工大學(xué) |
| 主分類號: | G06F16/22 | 分類號: | G06F16/22;G06F16/2458 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 650093 云*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 時空數(shù)據(jù) 關(guān)聯(lián)規(guī)則 事務(wù)表 時空 次掃描 置信度 挖掘 關(guān)聯(lián)規(guī)則分析 關(guān)聯(lián)關(guān)系 頻繁模式 轉(zhuǎn)換處理 分析 樹算法 構(gòu)建 維度 排序 三維 數(shù)據(jù)庫 保留 | ||
1.一種基于FP-樹的時空數(shù)據(jù)挖掘分析方法,其特征在于:
Step1、建立一個時空數(shù)據(jù)信息記錄的數(shù)據(jù)庫,并對數(shù)據(jù)進行轉(zhuǎn)換處理后生成新的事務(wù)表,表中包括以下字段:事務(wù)編號ID、空間謂詞、屬性值、時間值;
Step2、設(shè)置最小支持度閾值min_sup和最小置信度閾值min_conf,對事務(wù)表進行第一次掃描,去除掉事務(wù)表中所有支持度計數(shù)support_count_x小于最小支持度閾值的數(shù)據(jù)項,記錄剩余數(shù)據(jù)項的支持度計數(shù)并按降序排序,生成頻繁1-項集的新事務(wù)表;
Step3、對新事務(wù)表進行第二次掃描,初始化FP-樹,以字符null做為根節(jié)點,按照新事務(wù)表順序依次插入每條事務(wù)的數(shù)據(jù)項作為節(jié)點,生成對應(yīng)的分支路徑同時建立項頭表,項頭表中,在加入數(shù)據(jù)項節(jié)點時需統(tǒng)計其出現(xiàn)的次數(shù),形式為(Xi,N),Xi為第i個數(shù)據(jù)項,N為出現(xiàn)的次數(shù);
Step4、從FP-樹的每條路徑的結(jié)尾節(jié)點依次向上提取出相應(yīng)的3-項集,3-項集的支持度計數(shù)support_count_xj大于等于min_sup時,該3-項集作為頻繁3-項集l保留,反之剔除;
Step5、設(shè)每個頻繁3-項集l中的空間謂詞為子集s,若屬性值與時間值的集合(l-s)與s的支持度計數(shù)之比大于等于最小置信度閾值min_conf,則輸出強時空關(guān)聯(lián)規(guī)則該強規(guī)則的置信度大小為l與s的支持度計數(shù)之比的值將所計算出來的所有強時空關(guān)聯(lián)規(guī)則按照其置信度confidence的大小進行排序,生成時空關(guān)聯(lián)規(guī)則表;
Step6、將時空關(guān)聯(lián)規(guī)則表結(jié)合實驗數(shù)據(jù)的背景知識,對該結(jié)果進行相應(yīng)的意義分析、比較。
2.根據(jù)權(quán)利要求1所述的基于FP-樹的時空數(shù)據(jù)挖掘分析方法,其特征在于:所述步驟Step1中,收集到的時空數(shù)據(jù)包括名稱、屬性值、地址和發(fā)生時間,對其進行數(shù)據(jù)的轉(zhuǎn)換處理,具體步驟為:
(1)對收集的數(shù)據(jù)進行預(yù)處理,過濾掉不相關(guān)的冗余數(shù)據(jù),包括不在研究目標時間與空間范圍內(nèi)的數(shù)據(jù);
(2)對空間數(shù)據(jù)進行形式化處理,按各對象與某一目標對象的空間距離關(guān)系來對各個對象數(shù)據(jù)賦予相應(yīng)的空間謂詞;
(3)接著按事務(wù)具體發(fā)生的時間點,生成事務(wù)表來存儲處理過的時空數(shù)據(jù),事務(wù)表包括以下幾個字段:事務(wù)ID、空間謂詞、屬性值、時間點。
3.根據(jù)權(quán)利要求1所述的基于FP-樹的時空數(shù)據(jù)挖掘分析方法,其特征在于:所述步驟Step3中,分支路徑由根節(jié)點null和對應(yīng)的數(shù)據(jù)項節(jié)點組成,其中數(shù)據(jù)項節(jié)點的路徑順序為Step2中的頻繁項支持度計數(shù)降序排序。
4.根據(jù)權(quán)利要求1所述的基于FP-樹的時空數(shù)據(jù)挖掘分析方法,其特征在于:所述步驟Step5的強時空關(guān)聯(lián)規(guī)則置信度大小的計算公式如公式(1)所示:
其中:
式中,min_conf為最小置信度閾值;l為頻繁3-項集,s為l的空間謂詞非空子集;support_count(l)、support_count(s)、support_count(l-s)分別為括號內(nèi)字母的支持度計數(shù),為強時空關(guān)聯(lián)規(guī)則。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于昆明理工大學(xué),未經(jīng)昆明理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810877226.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于空間大數(shù)據(jù)進行知識挖掘的地圖可視化系統(tǒng)及方法
- 面向時空數(shù)據(jù)k近鄰查詢的分布式計算平臺及查詢方法
- 一種泛知識化時空對象表達數(shù)據(jù)庫建立方法
- 時空數(shù)據(jù)的存儲方法、查詢方法及存儲裝置、查詢裝置
- 多源異構(gòu)時空數(shù)據(jù)及其矢量可信構(gòu)建方法
- 一種數(shù)據(jù)比對碰撞方法和裝置
- 面向工業(yè)4.0的時空大數(shù)據(jù)分布式存儲檢索方法及系統(tǒng)
- 一種數(shù)據(jù)比對碰撞方法和裝置
- 時空數(shù)據(jù)的異常檢測方法、裝置、電子設(shè)備和存儲介質(zhì)
- 多維時空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種應(yīng)用流量識別方法及其系統(tǒng)
- 一種基于關(guān)聯(lián)規(guī)則樹的軋鋼產(chǎn)品質(zhì)量的預(yù)測方法及系統(tǒng)
- 顧及數(shù)據(jù)不確定性的關(guān)聯(lián)規(guī)則顯著性檢驗方法及裝置
- 一種主機變量異常檢測方法及系統(tǒng)
- 一種基于演化模糊關(guān)聯(lián)規(guī)則的中厚板質(zhì)量預(yù)測方法
- 一種主機及服務(wù)器
- 一種數(shù)據(jù)關(guān)聯(lián)處理方法、裝置、設(shè)備及介質(zhì)
- 保險產(chǎn)品測試方法、裝置和存儲介質(zhì)
- 基于關(guān)聯(lián)規(guī)則的碰撞預(yù)測方法、裝置、設(shè)備及存儲介質(zhì)
- 告警關(guān)聯(lián)規(guī)則匹配優(yōu)先級排序方法、裝置及存儲介質(zhì)
- 在使用商用服務(wù)器的無狀態(tài)體系結(jié)構(gòu)中的事務(wù)保護
- 基于影像的數(shù)據(jù)庫受損評估方法
- 事務(wù)信息處理方法和系統(tǒng)
- 在事務(wù)性中間件機器環(huán)境中提供分布式事務(wù)鎖的系統(tǒng)和方法
- 一種分布式事務(wù)管理方法及系統(tǒng)
- 一種同步活動事務(wù)表的方法及裝置
- 一種基于去重SSD的事務(wù)寫入方法
- 一種數(shù)據(jù)遷移方法、裝置、電子設(shè)備及可讀存儲介質(zhì)
- 基于日志解析同步的保障數(shù)據(jù)一致性的方法和同步系統(tǒng)
- 一種分布式事務(wù)處理方法、裝置、介質(zhì)和設(shè)備
- 一種時空地理大數(shù)據(jù)的檢索方法及系統(tǒng)
- 一種泛知識化時空對象表達數(shù)據(jù)庫建立方法
- 一種基于時空密度波與同步的大型時空數(shù)據(jù)聚類算法GRIDWAVE
- 時空數(shù)據(jù)的存儲方法、查詢方法及存儲裝置、查詢裝置
- 一種云環(huán)境下時空索引的構(gòu)建方法、裝置及電子設(shè)備
- 面向工業(yè)4.0的時空大數(shù)據(jù)分布式存儲檢索方法及系統(tǒng)
- 一種數(shù)據(jù)比對碰撞方法和裝置
- 時空數(shù)據(jù)的異常檢測方法、裝置、電子設(shè)備和存儲介質(zhì)
- 一種可直接捕獲時空相關(guān)性的時空數(shù)據(jù)預(yù)測方法
- 多維時空譜數(shù)據(jù)融合方法、裝置、電子設(shè)備和存儲介質(zhì)





