[發明專利]含主導特征的co?location模式挖掘方法在審
| 申請號: | 201710669858.0 | 申請日: | 2017-08-08 |
| 公開(公告)號: | CN107480713A | 公開(公告)日: | 2017-12-15 |
| 發明(設計)人: | 王麗珍;方圓;王曉璇;陳紅梅;周麗華 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙)11350 | 代理人: | 湯東鳳 |
| 地址: | 650091 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主導 特征 co location 模式 挖掘 方法 | ||
1.一種含主導特征的co-location模式挖掘方法,其特征在于,按照以下步驟進行:
步驟1,
根據距離閾值生成星型實例集;通過掃描星形關系生成一個k階co-location候選模式集ck={f1,…,fk};計算參與度;大于參與度閾值的模式即為一個頻繁的co-location模式;
步驟2,
對于該頻繁模式ck與該模式的k個k-1階子模式集合分別計算損失度;計算模式的最大特征影響度max_FII(ck)及最小特征影響度min_FII(ck);
步驟3,
通過最大特征影響度與最小特征影響度的差直接判斷該模式是否含有主導特征;
步驟4,
根據剪枝策略,利用最大特征差異度計算替代對模式中的每對特征進行兩兩特征差異度計算;
步驟5,
如果co-location模式ck被檢測為含主導特征的co-location模式,則通過計算模式中的每個特征來提取主要特征;計算每個特征的最大特征差異度并判斷該特征的最大特征差異度是否大于最小特征差異度閾值min_fd;將大于最小特征差異度閾值min_fd的特征加入模式ck的主導特征集合中;存儲含有主導特征的co-location模式;反復執行步驟1-4,逐階測試生成的co-location模式,直至無法再產生更高階的頻繁模式為止,最后得到了含主導特征的co-location模式集合及其主導特征集合。
2.根據權利要求1所述的含主導特征的co-location模式挖掘方法,其特征在于,所述步驟1按照以下步驟進行:根據距離閾值生成星型實例集,采用基于星型鄰居擴展的無連接算法生成,并按照下式計算參與度:
其中,PR(ck,fi)是空間特征fi在k階co-location模式ck={f1,…,fk}中的參與率,即fi的實例在T(ck)中不重復出現的個數與fi總實例個數的比率,PI(ck)是co-location模式ck的參與度,其為模式ck的所有空間特征的參與率值中的最小值;co-location模式ck的所有行實例的集合稱為表實例,記為T(ck);
給定一個空間特征集合F={f1,f2…,fn},一個與F對應的空間實例集合S=S1∪S2∪…∪Sn,其中Si是對應fi的實例集合,一個空間鄰近關系R,一個k階空間co-location模式及一組空間實例的子集若l包含ck的所有特征且所有實例滿足{R(ii,ij)|1≤i≤k,1≤j≤k}并形成團,則l稱為co-location模式ck中的一個行實例,其中R(ii,ij)的含義指實例ii與ij之間存在鄰近關系;空間特征fi在k階co-location模式ck={f1,…,fk}中的參與率是fi的實例在T(ck)中不重復出現的個數與fi總實例個數的比率,即,其中,π是關系的投影操作,co-location模式ck={f1,…,fk}的參與度PI(ck)是ck的所有空間特征的PR值中的最小值,即給定用戶定義的最小參與度閾值min_prev,若PI(ck)≥min_prev,則ck稱為頻繁的co-location模式,T({fi})的含義是特征fi在空間數據集中的實例個數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710669858.0/1.html,轉載請聲明來源鉆瓜專利網。





