[發(fā)明專利]微博媒體中的意見(jiàn)領(lǐng)袖識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201310032394.4 | 申請(qǐng)日: | 2013-01-26 |
| 公開(kāi)(公告)號(hào): | CN103150333A | 公開(kāi)(公告)日: | 2013-06-12 |
| 發(fā)明(設(shè)計(jì))人: | 鄭中華;高威;帥志虎;周銀行 | 申請(qǐng)(專利權(quán))人: | 安徽博約信息科技有限責(zé)任公司 |
| 主分類號(hào): | G06F17/30 | 分類號(hào): | G06F17/30 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 230000 安徽省合肥市高*** | 國(guó)省代碼: | 安徽;34 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 媒體 中的 意見(jiàn) 領(lǐng)袖 識(shí)別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及一種微博媒體中的意見(jiàn)領(lǐng)袖識(shí)別方法。
背景技術(shù)
進(jìn)入20世紀(jì),WEB2.0的發(fā)展促生了大量的網(wǎng)絡(luò)社區(qū)和微博這一新生代的信息交流平臺(tái),人們可以在不同社區(qū)和微博平臺(tái)內(nèi)交流信息和傳播思想。在網(wǎng)絡(luò)社區(qū)中同樣存在領(lǐng)域意見(jiàn)領(lǐng)袖,這些意見(jiàn)領(lǐng)袖在某種程度上影響著人們的購(gòu)買行為、政治觀點(diǎn)。很多人開(kāi)始研究信息傳播最大化問(wèn)題,也就是如何從社會(huì)網(wǎng)絡(luò)中選取一部分個(gè)體進(jìn)行信息傳播,以最大化信息的傳播。意見(jiàn)領(lǐng)袖在信息傳播和在市場(chǎng)營(yíng)銷等等其他各個(gè)方面的應(yīng)用有很大的影響。越來(lái)越多的人想從意見(jiàn)領(lǐng)袖角度去影響和促進(jìn)信息的傳播和擴(kuò)大某一方面的或某一信息的影響力。
在目前網(wǎng)絡(luò),一方面微博大部分采用實(shí)名認(rèn)證機(jī)制,可以對(duì)意見(jiàn)領(lǐng)袖的特征進(jìn)行分析;另一方面微博海量的數(shù)據(jù)為我們的研究提供了真實(shí)的歷史數(shù)據(jù),這些數(shù)據(jù)包括用戶的個(gè)人信息以及用戶在微博中的交互記錄,這些海量的數(shù)據(jù)以及用戶的資料是研究的一個(gè)重要的信息依據(jù)。目前主要的一些識(shí)別技術(shù)對(duì)微博用戶影響力進(jìn)行了定義,不同的研究思路有不同衡量標(biāo)準(zhǔn),有的使用粉絲數(shù)量和微博轉(zhuǎn)發(fā)數(shù)量對(duì)用戶影響力進(jìn)行了衡量,結(jié)果表明粉絲數(shù)量多的用戶微博不一定會(huì)得到很多的轉(zhuǎn)發(fā)或者評(píng)論,有的是給定一個(gè)主題,用戶的影響力定義為他的所有粉絲的影響力之和,還有一部分和本發(fā)明比較相近的是以入度、轉(zhuǎn)發(fā)數(shù)、提及數(shù)三項(xiàng)為影響力標(biāo)準(zhǔn)
現(xiàn)有技術(shù)的缺點(diǎn)如下:
1)在統(tǒng)計(jì)微博用戶信息數(shù)據(jù)的時(shí)候,沒(méi)有針對(duì)微博用戶的發(fā)表的言論的時(shí)間做深入的分析,但其發(fā)文頻率也是評(píng)價(jià)一個(gè)用戶的活躍度的標(biāo)準(zhǔn),活躍度也是意見(jiàn)領(lǐng)袖識(shí)別的一個(gè)重要因素,因而影響了識(shí)別的可靠性。
2)在以轉(zhuǎn)發(fā)、提及數(shù)為標(biāo)準(zhǔn)的時(shí)候,將所有的評(píng)論信息都當(dāng)作單一的信息對(duì)象處理,這樣極大的混淆了信息的質(zhì)量。意見(jiàn)領(lǐng)袖的影響力從客觀的角度是可分成兩方面的,一種是積極的正面影響,另一種是消極的負(fù)面影響。研究評(píng)論應(yīng)該深入的分析評(píng)論的正負(fù)性以判斷其可靠性和其影響趨勢(shì)。如果未能全面的處理將影響意見(jiàn)領(lǐng)袖的判斷。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問(wèn)題是提供一種從微博中準(zhǔn)確完善的分析用戶并快速準(zhǔn)確的找出意見(jiàn)領(lǐng)袖的識(shí)別方法。
為了解決上述技術(shù)問(wèn)題,本發(fā)明采用的技術(shù)方案是:微博媒體中的意見(jiàn)領(lǐng)袖識(shí)別方法,包括以下步驟:
一、網(wǎng)絡(luò)意見(jiàn)收集:
網(wǎng)絡(luò)意見(jiàn)的收集是通過(guò)微博平臺(tái)用戶發(fā)表的言論,通過(guò)網(wǎng)絡(luò)的合法的收集下載,下載大量的微博發(fā)文及其評(píng)論信息,并針對(duì)相關(guān)的話題比較活躍的進(jìn)行跟蹤的下載,將所有的發(fā)文按照用戶分類進(jìn)行抽取、統(tǒng)計(jì)以提供各方面的分析;
二、標(biāo)準(zhǔn)樣本庫(kù)標(biāo)注
選取一段時(shí)間內(nèi),有發(fā)言的微博作者,由相關(guān)的意見(jiàn)領(lǐng)袖識(shí)別專家對(duì)該作者進(jìn)行手工標(biāo)注,給出是否為意見(jiàn)領(lǐng)袖的判定,并從中選取一定量的微博作者放入標(biāo)準(zhǔn)樣本數(shù)據(jù)庫(kù);該樣本數(shù)據(jù)將作為后續(xù)意見(jiàn)領(lǐng)袖判定的標(biāo)注樣本集合;具體選取方法和選取數(shù)量請(qǐng)見(jiàn)具體實(shí)施方式;
三、意見(jiàn)個(gè)體活躍度:
1)個(gè)體活躍度由三個(gè)方面構(gòu)成,包括,某一段相關(guān)話題比較活躍的時(shí)間內(nèi),該作者平均每天發(fā)表的原創(chuàng)帖子數(shù)量記為Vorg,每天轉(zhuǎn)發(fā)的帖子數(shù)量,記為Vfor,每天評(píng)論的帖子數(shù)量記為Vrem,可以定義下述公式將該指標(biāo)量化;
L=WorgVorg+WforVfor+WremVrem??(1)
在(1)式中,Worg為原創(chuàng)帖子所占的活躍度權(quán)重,Wfor為轉(zhuǎn)發(fā)帖子所占的活躍度權(quán)重,Wrem為評(píng)論帖子所占的活躍度權(quán)重;為了防止具有較大初始值的屬性與具有較小初始值的屬性相比,權(quán)重過(guò)大,需要先將上述三種帖子數(shù)量進(jìn)行規(guī)范化后再代入公式進(jìn)行計(jì)算;規(guī)范化和參數(shù)確定具體方法請(qǐng)見(jiàn)具體實(shí)施方式;
四、意見(jiàn)個(gè)體受關(guān)注度:
如果意見(jiàn)個(gè)體所發(fā)的微博受關(guān)注程度越高,則越可能是意見(jiàn)領(lǐng)袖,為此定義平均轉(zhuǎn)發(fā)數(shù)、平均瀏覽數(shù)、平均評(píng)論數(shù)三種指標(biāo)如下;
1)平均轉(zhuǎn)發(fā)數(shù)M=Tt/N,其中:N為發(fā)文量,Tt為所有發(fā)文轉(zhuǎn)發(fā)總數(shù);
2)平均瀏覽數(shù)S=Tc/N,其中:N發(fā)文量,Tc為所有發(fā)文瀏覽數(shù)的總數(shù);
3)平均評(píng)論數(shù)P=Td/N,其中:N發(fā)文量,Td為所有發(fā)文評(píng)論數(shù)的總數(shù);
4)平均轉(zhuǎn)發(fā)數(shù)的權(quán)重比為Wm,平均瀏覽數(shù)的權(quán)重比為Ws,平均評(píng)論數(shù)的權(quán)重比為Wp;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽博約信息科技有限責(zé)任公司,未經(jīng)安徽博約信息科技有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310032394.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F17-00 特別適用于特定功能的數(shù)字計(jì)算設(shè)備或數(shù)據(jù)處理設(shè)備或數(shù)據(jù)處理方法
G06F17-10 .復(fù)雜數(shù)學(xué)運(yùn)算的
G06F17-20 .處理自然語(yǔ)言數(shù)據(jù)的
G06F17-30 .信息檢索;及其數(shù)據(jù)庫(kù)結(jié)構(gòu)
G06F17-40 .數(shù)據(jù)的獲取和記錄
G06F17-50 .計(jì)算機(jī)輔助設(shè)計(jì)
- 自主計(jì)算系統(tǒng)和方法
- 匯集意見(jiàn)及調(diào)查資料的方法
- 微博媒體中的意見(jiàn)領(lǐng)袖識(shí)別方法
- 用于管理意見(jiàn)數(shù)據(jù)的方法和設(shè)備
- 問(wèn)題反饋方法、裝置和反饋服務(wù)器
- 公共設(shè)施意見(jiàn)收集裝置
- 一種鋼琴教學(xué)用家長(zhǎng)意見(jiàn)登記系統(tǒng)
- 基于國(guó)產(chǎn)CPU的審批意見(jiàn)設(shè)置方法、裝置及介質(zhì)
- 一種基于表達(dá)與隱私模型的意見(jiàn)動(dòng)力學(xué)的設(shè)計(jì)方法及系統(tǒng)
- 電網(wǎng)評(píng)審意見(jiàn)的在線編輯方法、系統(tǒng)、終端和存儲(chǔ)介質(zhì)
- 一種耐洗的不卷邊針織領(lǐng)袖的制作方法
- 可延伸襯衣領(lǐng)袖的制作方法
- 領(lǐng)袖生產(chǎn)編排方法及系統(tǒng)
- 一種基于網(wǎng)絡(luò)度相關(guān)性的信息傳播領(lǐng)袖節(jié)點(diǎn)提取方法
- 一種基于聚類的社交網(wǎng)絡(luò)意見(jiàn)領(lǐng)袖挖掘方法
- 絲光領(lǐng)袖染色方法及絲光領(lǐng)袖生產(chǎn)方法
- 領(lǐng)袖長(zhǎng)度監(jiān)測(cè)方法及裝置
- 一種基于K-核分解獲取社交網(wǎng)絡(luò)意見(jiàn)領(lǐng)袖的方法
- 領(lǐng)袖長(zhǎng)度監(jiān)測(cè)裝置
- 一種關(guān)鍵意見(jiàn)領(lǐng)袖影響力計(jì)算方法和系統(tǒng)





