[發明專利]一種網絡社區活躍用戶簇的發現方法、終端設備及存儲介質在審
| 申請號: | 201711096102.8 | 申請日: | 2017-11-09 |
| 公開(公告)號: | CN107749033A | 公開(公告)日: | 2018-03-02 |
| 發明(設計)人: | 徐曉文;李火泉;欒江霞;章正道 | 申請(專利權)人: | 廈門市美亞柏科信息股份有限公司 |
| 主分類號: | G06Q50/00 | 分類號: | G06Q50/00;G06K9/62 |
| 代理公司: | 廈門市精誠新創知識產權代理有限公司35218 | 代理人: | 何家富 |
| 地址: | 361000 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 網絡 社區 活躍 用戶 發現 方法 終端設備 存儲 介質 | ||
技術領域
本發明涉及數據挖掘技術領域,具體是一種網絡社區活躍用戶簇的發現方法、終端設備及存儲介質。
背景技術
隨著互聯網的迅速發展,社會空間已由現實的空間擴大到虛擬的網絡空間,網絡中的用戶群體對社會的發展將產生巨大的影響,因此很有必要對網絡社區中的用戶按照活躍度劃分,以便及時獲取用戶在網絡社會的動態和虛擬社會的信息,保證挖掘用戶數據的時效性和完整性。
目前社區活躍用戶的發現方法主要有社會關系的研究方法和統計用戶發帖量變化的顯示的特征方法。
社會關系的研究方法,該方法將整個網絡定義為一張圖,每個用戶作為圖中的頂點,用戶之間的關系作為圖的邊,把用戶之間的關系作為用戶活躍度的判定,將與其他頂點有相連邊的點認為是活躍用戶。該方法在用戶活躍度判定方面有一定的參考依據,但是它完全忽略了網絡社會中建立關系的低成本和容易性,此方法將造成很多關注了其他用戶的賬號被認為是活躍用戶,然而與事實不符,因為存在不少出于商業目的注冊的賬號關注了大量用戶而不再使用的可能。
統計用戶發帖量變化的顯示方法,該方法統計每個用戶在一定時間段的發帖量,將發帖量與時間段繪制成變化曲線,由曲線的變化率來判斷用戶的活躍度。此方法僅僅只是把用戶的發帖量作為衡量用戶活躍度的唯一標準,完全忽略了其他影響因素的存在。
因此需要一種能夠綜合考慮發帖量及發帖時間、社會關系等多種因素的活躍用戶簇的發現方法或裝置。
發明內容
為了解決上述問題,本發明旨在提供一種網絡社區活躍用戶簇的發現方法、終端設備及存儲介質,通過對用戶在網絡社區內部的信息交流數據和社交關系數據進行綜合考慮,建立用戶特征數據模型,通過聚類算法找出活躍用戶簇。
具體方案如下:
一種網絡社區活躍用戶簇的發現方法,包括以下步驟:
S10:通過網絡社區軟件收集該網絡社區內的用戶群體;
S20:獲取代表用戶活躍度的用戶特征數據,包括交互數據和關系數據;所述交互數據為用戶通過網絡社區軟件進行信息交流的數據,關系數據為用戶在網絡社區內部與其他用戶建立聯系的數據;
S30:去除低活躍度用戶,即交互數據和關系數據均低的用戶;
S40:根據特征數據對用戶活躍度的影響大小不同確定用戶特征數據的權重系數,影響大的特征數據所占的權重系數大,影響小的特征數據所占的權重系數小,用戶的所有特征數據所對應的權重系數總和為1;
S50:根據各特征數據及其所占權重的值,得到每個用戶的特征數據模型;
S60:通過聚類算法根據用戶的相似度將用戶分為不同的用戶簇;
S70:通過計算各用戶簇的聚類中心用戶與完全不活躍用戶的距離確定活躍用戶簇。
進一步的,所述步驟S10內的用戶群體收集方式包括:
S101:通過設定關鍵字,使用網絡社區官方軟件的編程接口進行搜索得到初始用戶群;
S102:通過收集初始用戶群在上述網絡社區官方軟件內的社交關系用戶得到最終用戶群。
進一步的,所述步驟S20內的交互數據包括發帖總量、最近一月發帖量、原創帖量,關系數據包括關注數和粉絲數,即用戶的特征數據包括發帖總量、最近一月發帖量、原創帖量、關注數和粉絲數,其中發帖總量、最近一月發帖量、原創帖量、關注數和粉絲數分別用mbi、mri、moi、foi和fai來表示,其中i為用戶編號,值為1、2、3……、n中的某一個,當i為不同值時分別對應不同的用戶。
進一步的,所述步驟S40內權重系數的設定中,發帖總量、最近一月發帖量、原創帖量、關注數和粉絲數所占的權重系數分別為:n_mb=0.1、n_mr=0.3、n_mo=0.3、n_fo=0.1、n_fa=0.2,其中n_mb表示發帖總量的權重系數、n_mr表示最近一月發帖量的權重系數、n_mo表示原創帖量的權重系數、n_fo表示關注數的權重系數、n_fa表示粉絲數的權重系數。
進一步的,所述步驟S50內的用戶特征數據模型為:
Fi=(nmbi,nmri,nmoi,nfoi,nfai),
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門市美亞柏科信息股份有限公司,未經廈門市美亞柏科信息股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711096102.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電子設備
- 下一篇:一種2.5維閉合環型頻率選擇表面結構





