[發明專利]含主導特征的co?location模式挖掘方法在審
| 申請號: | 201710669858.0 | 申請日: | 2017-08-08 |
| 公開(公告)號: | CN107480713A | 公開(公告)日: | 2017-12-15 |
| 發明(設計)人: | 王麗珍;方圓;王曉璇;陳紅梅;周麗華 | 申請(專利權)人: | 云南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京科億知識產權代理事務所(普通合伙)11350 | 代理人: | 湯東鳳 |
| 地址: | 650091 云*** | 國省代碼: | 云南;53 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 主導 特征 co location 模式 挖掘 方法 | ||
技術領域
本發明屬于空間并置模式挖掘技術領域,特別是涉及一種含主導特征的co-location模式挖掘方法。
背景技術
空間co-location模式(并置模式)挖掘是空間數據挖掘的重要分支,在環境保護,公共交通,定位服務和城市規劃等領域有著廣泛應用。空間co-location模式是一組在空間中頻繁并置的空間特征的子集,例如,{餐廳,超市,咖啡店}是一個普遍的co-location模式,意味著餐廳,超市和咖啡店經常在空間中共同出現。空間co-location模式挖掘一般采用最小參與率(參與度)為度量標準的挖掘框架。將特征的參與率作為空間特征頻繁性的度量指標,并使用參與度作為度量空間co-location模式頻繁性的指標,通過用戶指定的參與度閾值對co-location頻繁模式進行挖掘。然而,在某些情況下,用戶不僅對一個co-location模式出現在空間中的頻繁程度興趣,而且還關注模式中是否有哪些特征在模式中起主導作用。含有主導特征的co-location模式不僅表明該模式在空間中頻繁并置,更重要的是,它表明在同一個co-location模式中的某些特征如何主導其它特征。
確定一個co-location模式是否含有主導特征,并且從co-location模式中提取主導特征具有十分廣泛的實際應用。例如:含主導特征的co-location模式挖掘能夠幫助植物學家從植物群落中提取優勢種。盡管植被數據上的頻繁co-location模式挖掘可以發現不同植物間的共存關系,但植物學家仍然需要更多的信息才能夠確定頻繁并置的植物物種中是否含有優勢物種及優勢物種的具體種類。含主導特征的co-location模式挖掘的另一個應用是能夠幫助用戶確定城市規劃的主導設施。在城市規劃中,通過對城市興趣點進行含主導特征的co-location城市興趣點挖掘,能夠進一步支持合理的城市規劃和業務決策。因此,從頻繁co-location模式進一步發現具有主導特征的co-location模式是十分必要的。
在挖掘到的大量頻繁co-location模式結果集中,進一步識別含有主導特征的模式,并摘取主導特征,將有效提高挖掘到的頻繁co-location模式的可用性,方便用戶對挖掘結果的理解和使用具有重要意義。傳統co-location挖掘算法采用參與率度量特征在模式中的作用。然而,這樣的度量只考慮單個特征的實例參與到模式中的比例,沒有考慮到特征之間的影響。為了描述特征之間的相互影響,需要通過頻繁模式與其所有直接子模式的參與率變化來分析新特征加入時,該模式中其它特征的影響。
而且現有的參與率-參與度度量無法標識含有主導特征的頻繁co-location模式,也無法識別頻繁co-location模式中的主導特征。因此,亟需提出含主導特征的空間co-location模式及主導特征的新概念,提出識別含有主導特征的co-location模式及摘取主導特征的新方法。
而識別空間co-location模式的主導特征主要存在兩方面的挑戰。目前的方法關注尋找模式中特征的頻繁并置,忽略了不同特征對模式貢獻的差異。因此,如何定義和度量含有主導特征頻繁co-location模式及其主導特征是第一個挑戰。面對挖掘到的大量co-location模式,如何高效地挖掘含有主導特征的co-location模式及主導特征集是第二個挑戰。
發明內容
本發明實施例的目的在于提供一種含主導特征的co-location模式挖掘方法,解決了現有co-location頻繁模式挖掘結果數量大、針對性不足的問題,能夠有效縮減模式結果。
本發明所采用的技術方案是,一種含主導特征的co-location模式挖掘方法,按照以下步驟進行:
步驟1,
根據距離閾值生成星型實例集;通過掃描星形關系生成一個k階co-location候選模式集ck={f1,…,fk};計算參與度;大于參與度閾值的模式即為一個頻繁的co-location模式;
步驟2,
對于該頻繁模式ck與該模式的k個k-1階子模式集合分別計算損失度;計算模式的最大特征影響度max_FII(ck)及最小特征影響度min_FII(ck);
步驟3,
通過最大特征影響度與最小特征影響度的差直接判斷該模式是否含有主導特征;
步驟4,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云南大學,未經云南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710669858.0/2.html,轉載請聲明來源鉆瓜專利網。





