[發明專利]社區劃分方法及裝置在審
| 申請號: | 201710444988.4 | 申請日: | 2017-06-12 |
| 公開(公告)號: | CN107341733A | 公開(公告)日: | 2017-11-10 |
| 發明(設計)人: | 杜翠鳳 | 申請(專利權)人: | 廣州杰賽科技股份有限公司 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 梁順宜,郝傳鑫 |
| 地址: | 510310 廣東省廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 社區 劃分 方法 裝置 | ||
1.一種社區劃分方法,其特征在于,包括步驟:
接收若干個待劃分用戶的信息,根據所述待劃分用戶的信息建立拓撲結構圖;
計算所述拓撲結構圖中各個節點的度,將所述拓撲結構圖中度數最大的節點作為種子節點,獲取所述種子節點的鄰居節點;
根據每一所述鄰居節點的鄰域屬性,計算所述種子節點對每一所述鄰居節點的投入精力占比;
根據所述種子節點對每一所述鄰居節點的投入精力占比,通過結構洞的網格約束算法獲取所述種子節點對每一所述鄰居節點的約束系數;
將所述約束系數大于預設的關系閾值的鄰居節點和所述種子節點劃分為同一社團,并將所述約束系數大于預設的閾值的鄰居節點和所述種子節點從所述拓撲結構圖中刪除。
2.如權利要求1所述的社區劃分方法,其特征在于,所述根據每一所述鄰居節點的鄰域屬性,計算所述種子節點對每一所述鄰居節點的投入精力占比具體為:
獲取每一所述鄰居節點的鄰接度,分別計算每一所述鄰居節點的鄰接度占所述每一所述鄰居節點的鄰接度的總和的比例,從而獲得所述種子節點對每一所述鄰居節點的投入精力占比;其中,任一節點的鄰接度為所述節點的鄰居節點的度數總和。
3.如權利要求2所述的社區劃分方法,其特征在于,所述根據所述種子節點對每一所述鄰居節點的投入精力占比,通過結構洞的網格約束算法獲取所述種子節點對每一所述鄰居節點的約束系數具體為:
通過以下公式獲取所述種子節點對每一所述鄰居節點的約束系數:
其中,Cij為所述種子節點i對任一所述鄰居節點j的約束系數,Pij所述種子節點i對所述鄰居節點j的投入精力占比,q為所述種子節點i和鄰居節點j的共同鄰居節點,Piq和Pqj分別是所述種子節點i對節點q的投入精力占比和節點q對所述鄰居節點j的投入精力占比。
4.如權利要求1~3任一項所述的社區劃分方法,其特征在于,所述預設的關系閾值為最優關系閾值,所述最優關系閾值通過以下步驟獲得:
接收若干個訓練數據,以預設的步長設立若干個關系閾值,基于每一所述關系閾值采用權利要求1所述的社區劃分方法對所述訓練數據進行社區劃分;
計算每一所述閾值下社區劃分的模塊度值,通過優化所述模塊度值從而獲取所述最優關系閾值。
5.如權利要求1~3任一項所述的社區劃分方法,所述預設的關系閾值為最優關系閾值,所述最優關系閾值通過以下步驟獲得:
接收若干個已標記社區劃分的訓練數據,以預設的步長設立若干個關系閾值,基于每一所述關系閾值采用權利要求1所述的社區劃分方法對所述訓練數據進行社區劃分;
計算每一所述閾值下社區劃分的標準互信息,通過優化所述標準互信息從而獲取所述最優關系閾值;其中,所述標準互信息根據所述訓練數據的已標記社區劃分和采用權利要求1所述的社區劃分方法的社區劃分獲得。
6.如權利要求1~3所述的社區劃分方法,其特征在于,所述預設的關系閾值為最優關系閾值,所述最優關系閾值通過以下步驟獲得:
接收若干個已標記社區劃分的訓練數據,以預設的步長設立若干個關系閾值,基于每一所述閾值采用權利要求1所述的社區劃分方法對所述訓練數據進行社區劃分;
計算每一所述閾值下社區劃分的社區劃分精度,通過優化所述社區劃分精度從而獲取所述最優關系閾值;其中,所述社區劃分精度根據所述訓練數據的已標記社區劃分和采用權利要求1所述的社區劃分方法的社區劃分獲得。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州杰賽科技股份有限公司,未經廣州杰賽科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710444988.4/1.html,轉載請聲明來源鉆瓜專利網。





