[發(fā)明專(zhuān)利]一種基于微博用戶自身和行為價(jià)值二階的影響力評(píng)估方法有效
| 申請(qǐng)?zhí)枺?/td> | 201811393912.4 | 申請(qǐng)日: | 2018-11-21 |
| 公開(kāi)(公告)號(hào): | CN109492924B | 公開(kāi)(公告)日: | 2022-05-17 |
| 發(fā)明(設(shè)計(jì))人: | 楊靜;馬博文;張健沛;王勇 | 申請(qǐng)(專(zhuān)利權(quán))人: | 哈爾濱工程大學(xué) |
| 主分類(lèi)號(hào): | G06Q10/06 | 分類(lèi)號(hào): | G06Q10/06;G06Q50/00;G06F16/951 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區(qū)*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 用戶 自身 行為 價(jià)值 影響力 評(píng)估 方法 | ||
一種基于微博用戶自身和行為價(jià)值二階的影響力評(píng)估方法,屬于計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)領(lǐng)域。包括:(1)利用爬蟲(chóng)技術(shù)和微博官方API接口采集微博數(shù)據(jù);(2)對(duì)采集后的數(shù)據(jù)處理,得出所需用戶的特征向量;(3)通過(guò)用戶所有粉絲的自身價(jià)值來(lái)計(jì)算該用戶的自身價(jià)值;(4)通過(guò)用戶所有推送轉(zhuǎn)發(fā)者的行為價(jià)值來(lái)計(jì)算用戶的行為價(jià)值;(5)綜合用戶的自身與行為價(jià)值計(jì)算用戶最終的影響力。本發(fā)明通過(guò)對(duì)用戶粉絲數(shù)量、質(zhì)量的計(jì)算和用戶推送微博的轉(zhuǎn)發(fā)者行為質(zhì)量的計(jì)算,即避免了僵尸粉、推銷(xiāo)商造成的虛假影響力又突出了推送較少但質(zhì)量極高的用戶的隱藏影響力;對(duì)于發(fā)現(xiàn)微博平臺(tái)中信息的傳播規(guī)律、廣告投放、病毒式營(yíng)銷(xiāo)和輿情管控等工作具有重要意義。
技術(shù)領(lǐng)域
本發(fā)明屬于計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)領(lǐng)域,具體涉及一種基于微博用戶自身和行為價(jià)值二階的影響力評(píng)估方法。
背景技術(shù)
隨著Web2.0技術(shù)的發(fā)展和成熟加速了社交網(wǎng)絡(luò)媒體平臺(tái)的普及和多樣化,微博以其極快的內(nèi)容獲取和更新速度獲取了大量用戶,躍身成為國(guó)內(nèi)最大的社交媒體平臺(tái)。因此對(duì)微博中高影響力節(jié)點(diǎn)的挖掘算法研究有助于發(fā)現(xiàn)微博平臺(tái)中內(nèi)容信息的傳播規(guī)律,可以為相應(yīng)的企業(yè)用戶、管理者用戶進(jìn)行廣告投放、病毒式營(yíng)銷(xiāo)和輿情管控等提供可靠實(shí)時(shí)的理論數(shù)據(jù)依據(jù)。
目前,常見(jiàn)方法都是從以下3個(gè)角度對(duì)社會(huì)網(wǎng)絡(luò)高影響力節(jié)點(diǎn)進(jìn)行挖掘:第一基于拓?fù)浣Y(jié)構(gòu)的特征度量,局部屬性如節(jié)點(diǎn)的度中心性,全局屬性如節(jié)點(diǎn)的緊密中心性、介數(shù)中心性等,基于隨機(jī)游走的度量PageRank、HITS等算法通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)中的用戶節(jié)點(diǎn)打分來(lái)區(qū)分用戶影響力的大??;第二基于行為的特征度量,如傳播范圍分析、用戶活躍度分析;第三基于內(nèi)容的特征度量,如話題分析、相似性分析等。然而上述方法大多是從單方面去評(píng)價(jià)用戶影響力,即使結(jié)合多個(gè)角度去計(jì)算也與現(xiàn)實(shí)結(jié)果存在差異,方法的時(shí)間復(fù)雜度和準(zhǔn)確性有待優(yōu)化。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于微博用戶自身和行為價(jià)值二階的影響力評(píng)估方法,最大可能性的避免了僵尸粉、推銷(xiāo)商造成的虛假影響力又突出了推送較少但質(zhì)量極高的用戶的隱藏影響力。相較于其他方法花費(fèi)時(shí)間更少,準(zhǔn)確度更高。從而為相應(yīng)的企業(yè)用戶、管理者、學(xué)術(shù)研究者更加準(zhǔn)確快速的挑選更具影響力的微博用戶。
本發(fā)明的目的是這樣實(shí)現(xiàn)的:
一種基于微博用戶自身和行為價(jià)值二階的影響力評(píng)估方法,包括如下步驟:
步驟一:利用爬蟲(chóng)技術(shù)和微博官方API接口采集微博數(shù)據(jù);
步驟二:對(duì)步驟一中采集的數(shù)據(jù)進(jìn)行處理,包括用戶靜態(tài)屬性的清理,用戶動(dòng)態(tài)行為信息的篩選,得到方法所需用戶的特征向量;
步驟三:通過(guò)用戶所有粉絲的自身價(jià)值來(lái)計(jì)算該用戶的自身價(jià)值;
步驟四:通過(guò)用戶所有推送轉(zhuǎn)發(fā)者的行為價(jià)值來(lái)計(jì)算用戶的行為價(jià)值;
步驟五:綜合用戶的自身與行為價(jià)值計(jì)算用戶最終的影響力。
所述步驟一中,利用爬蟲(chóng)技術(shù)采集微博數(shù)據(jù)后,按照話題分類(lèi)采集用戶和用戶關(guān)注者、粉絲的全部信息。
所述步驟二中,用戶靜態(tài)屬性的清理具體指清理出采集到數(shù)據(jù)中用戶粉絲ID、數(shù)量、推送微博ID、數(shù)量、轉(zhuǎn)發(fā)者ID;用戶動(dòng)態(tài)行為信息的篩選具體指將用戶的粉絲、轉(zhuǎn)發(fā)者做為用戶進(jìn)行二次迭代分析。
所述步驟三中,用戶的自身價(jià)值計(jì)算公式為:
其中ki表示用戶i的粉絲數(shù),kj1表示用戶i的第j1個(gè)粉絲的粉絲量。
所述步驟四中,用戶的行為價(jià)值計(jì)算公式為:
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于哈爾濱工程大學(xué),未經(jīng)哈爾濱工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811393912.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 上一篇:一種基于生產(chǎn)損失的多態(tài)生產(chǎn)系統(tǒng)重要度分析方法、裝置
- 下一篇:山火誘發(fā)鋼結(jié)構(gòu)桿塔結(jié)構(gòu)失效的仿真模擬和安全預(yù)警方法
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06Q 專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的數(shù)據(jù)處理系統(tǒng)或方法;其他類(lèi)目不包含的專(zhuān)門(mén)適用于行政、商業(yè)、金融、管理、監(jiān)督或預(yù)測(cè)目的的處理系統(tǒng)或方法
G06Q10-00 行政;管理
G06Q10-02 .預(yù)定,例如用于門(mén)票、服務(wù)或事件的
G06Q10-04 .預(yù)測(cè)或優(yōu)化,例如線性規(guī)劃、“旅行商問(wèn)題”或“下料問(wèn)題”
G06Q10-06 .資源、工作流、人員或項(xiàng)目管理,例如組織、規(guī)劃、調(diào)度或分配時(shí)間、人員或機(jī)器資源;企業(yè)規(guī)劃;組織模型
G06Q10-08 .物流,例如倉(cāng)儲(chǔ)、裝貨、配送或運(yùn)輸;存貨或庫(kù)存管理,例如訂貨、采購(gòu)或平衡訂單
G06Q10-10 .辦公自動(dòng)化,例如電子郵件或群件的計(jì)算機(jī)輔助管理
- 過(guò)濾以及監(jiān)控程序的行為的方法
- 數(shù)據(jù)挖掘的方法和裝置
- 網(wǎng)絡(luò)異常行為檢測(cè)方法及檢測(cè)裝置
- 基于大數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘的異常行為檢測(cè)方法和系統(tǒng)
- 用于檢測(cè)用戶行為的方法和裝置
- 行為數(shù)據(jù)分析方法及裝置
- 一種基于網(wǎng)絡(luò)的行為教育方法
- 網(wǎng)絡(luò)行為分類(lèi)方法、設(shè)備、存儲(chǔ)介質(zhì)及裝置
- 一種在線支付業(yè)務(wù)行為的異常檢測(cè)方法、裝置及電子設(shè)備
- 行為采集方法及系統(tǒng)





