日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于最大頻繁項(xiàng)集挖掘的微博炒作群體發(fā)現(xiàn)方法有效

專利信息
申請?zhí)枺?/td> 201410188004.7 申請日: 2014-05-07
公開(公告)號: CN103927398A 公開(公告)日: 2014-07-16
發(fā)明(設(shè)計(jì))人: 劉琰;張進(jìn);羅軍勇;羅向陽;董雨辰;陳靜;常斌 申請(專利權(quán))人: 中國人民解放軍信息工程大學(xué)
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 鄭州天陽專利事務(wù)所(普通合伙) 41113 代理人: 聶孟民
地址: 450052 *** 國省代碼: 河南;41
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 最大 頻繁 挖掘 炒作 群體 發(fā)現(xiàn) 方法
【權(quán)利要求書】:

1.一種基于最大頻繁項(xiàng)集挖掘的微博炒作群體發(fā)現(xiàn)方法,其特征在于,包括如下步驟:

(1)炒作微博樣本搜集:以炒作微博的相關(guān)性為線索,基于爬蟲技術(shù)或微博公共開放平臺獲取參與炒作微博傳播的賬戶集合;

(2)事務(wù)數(shù)據(jù)庫構(gòu)建:以單個(gè)微博為事務(wù),參與微博傳播的賬戶為項(xiàng),構(gòu)建炒作微博事務(wù)數(shù)據(jù)庫;

(3)最大頻繁項(xiàng)集挖掘:對待檢測微博組所對應(yīng)的事務(wù)數(shù)據(jù)庫中的每個(gè)事務(wù),利用迭代交集法找出所有事務(wù)中包含的最大頻繁項(xiàng)集,得到若干最大頻繁項(xiàng)集集合;

由于炒作微博事務(wù)庫中每個(gè)事務(wù)包含的項(xiàng)目大都數(shù)以萬計(jì),直接在原始事務(wù)數(shù)據(jù)庫中挖掘最大頻繁項(xiàng)集將會影響算法執(zhí)行的效率,利用二分查找法,快速剔除事務(wù)中的非頻繁項(xiàng)目,找出最大頻繁項(xiàng)集的候選集合,縮減事務(wù)數(shù)據(jù)庫規(guī)模;

(4)最大頻繁項(xiàng)集歸并:對每個(gè)最大頻繁項(xiàng)集,計(jì)算項(xiàng)集間的重疊率,對最大頻繁項(xiàng)集進(jìn)行合并,盡量將規(guī)模較小的項(xiàng)集歸并到較大項(xiàng)集中,并保證歸并后項(xiàng)集中的賬戶依然具有一定的關(guān)聯(lián)性;通過縮減事務(wù)數(shù)據(jù)庫規(guī)模,減少交集次數(shù),事務(wù)間取交集時(shí),采用二分查找法判斷事務(wù)中是否包含某項(xiàng)目,以提高挖掘最大頻繁項(xiàng)集的效率,從而發(fā)現(xiàn)微博炒作群體。

2.根據(jù)權(quán)利要求1所述的基于最大頻繁項(xiàng)集挖掘的微博炒作群體發(fā)現(xiàn)方法,其特征在于,包括炒作微博事務(wù)庫、最大頻繁項(xiàng)集挖掘以及最大頻繁項(xiàng)集歸并部分,炒作微博事務(wù)庫構(gòu)建模塊主要負(fù)責(zé)采集數(shù)據(jù)并進(jìn)行預(yù)處理,構(gòu)建事務(wù)數(shù)據(jù)庫D;最大頻繁項(xiàng)集挖掘模塊首先基于二分查找方法篩選候選最大頻繁項(xiàng)集,然后基于迭代交集方法從事務(wù)數(shù)據(jù)庫D中挖掘出最大頻繁項(xiàng)集MFS;最大頻繁項(xiàng)集歸并模塊主要對MFS進(jìn)行歸并處理,還原真實(shí)的炒作群體,具體步驟是:

1)、搜集炒作微博樣本

炒作微博樣本搜集實(shí)現(xiàn)本發(fā)明的最初步驟,微博樣本的選擇應(yīng)具有相關(guān)性,若某個(gè)炒作賬戶曾經(jīng)參與的若干微博,或與某個(gè)主題相關(guān)的若干微博,微博樣本的判定應(yīng)借鑒已有的成熟判別方法或?qū)<蚁到y(tǒng),炒作微博樣本搜集有兩種方法:一種方法是選擇爬蟲技術(shù),從微博網(wǎng)頁下載網(wǎng)頁、解析頁面結(jié)構(gòu)并提取微博傳播賬戶的信息;另一種方法是調(diào)用微博公共開放平臺,調(diào)用微博官方對外提供的API函數(shù)獲取微博傳播賬戶的信息;

按照待挖掘炒作賬戶的算法分析條件,樣本搜集的內(nèi)容應(yīng)包括微博標(biāo)識號、微博賬戶標(biāo)識號、微博賬戶的基本信息;

2)構(gòu)建事務(wù)數(shù)據(jù)庫

將炒作群體發(fā)現(xiàn)問題轉(zhuǎn)化為數(shù)據(jù)挖掘中的最大頻繁項(xiàng)集挖掘,在炒作微博樣本搜集的基礎(chǔ)上,將炒作微博對應(yīng)事務(wù),參與微博轉(zhuǎn)發(fā)的賬戶對應(yīng)事務(wù)中的項(xiàng),構(gòu)建事務(wù)數(shù)據(jù)庫,如圖2所示;

3)基于二分查找的候選最大頻繁項(xiàng)集篩選

由于炒作微博事務(wù)庫中每個(gè)事務(wù)包含的項(xiàng)目大都數(shù)以萬計(jì),直接在原始事務(wù)庫中挖掘最大頻繁項(xiàng)集將會影響算法執(zhí)行的效率,基于二分查找的方法,能夠快速剔除事務(wù)中的非頻繁項(xiàng)目,找出最大頻繁項(xiàng)集的候選集合,縮減事務(wù)庫規(guī)模,給定事務(wù)數(shù)據(jù)庫D,最小支持?jǐn)?shù)S,進(jìn)行候選最大頻繁項(xiàng)集篩選,方法是:

(1)將事務(wù)庫D中的事務(wù)按項(xiàng)目個(gè)數(shù)從大到小排序

(2)記頻繁項(xiàng)目集合,非頻繁項(xiàng)目集合;從i=1開始,按順序遍歷D中的每個(gè)事務(wù)Ti(1≤i≤|D|),對事務(wù)Ti中的每個(gè)項(xiàng)目u:

a)若u∈FI,則保留u;

b)若u∈NFI,則從Ti中剔除u;

c)若,則轉(zhuǎn)到下一步判斷u是否是頻繁項(xiàng)目;

(3)、從j=i+1開始遍歷剩余的事務(wù),并利用二分查找法判斷Tj,i<j≤|D|中是否包含u,終止條件為:

a)當(dāng)包含u的事務(wù)個(gè)數(shù)達(dá)到S時(shí),說明u是頻繁項(xiàng)目,將u加入到FI中;

b)當(dāng)剩余的事務(wù)個(gè)數(shù)與包含了u的事務(wù)個(gè)數(shù)之和小于S時(shí),說明u是非頻繁項(xiàng)目,從Ti中剔除u,若此時(shí)包含了u的事務(wù)個(gè)數(shù)大于1,說明u還出現(xiàn)在Ti之外的事務(wù)中,則將u加入到NFI中;

(4)剔除完D中所有事務(wù)中的非頻繁項(xiàng)目后,即可得到縮減后的事務(wù)庫D1

4)基于迭代交集的最大頻繁項(xiàng)集挖掘:

通過對事務(wù)迭代取交集的方式挖掘最大頻繁項(xiàng)集,給定縮減后的事務(wù)庫D1,最小支持?jǐn)?shù)S,最大頻繁項(xiàng)集挖掘的方法如下:

(1)將事務(wù)庫D1中的事務(wù)按項(xiàng)的個(gè)數(shù)從大到小排序,以盡早發(fā)現(xiàn)最大頻繁項(xiàng)集,為縮減事務(wù)庫規(guī)模,合并事務(wù)庫中重復(fù)的事務(wù),并對事務(wù)個(gè)數(shù)計(jì)數(shù);

(2)為減少取交集的次數(shù),對于事務(wù)Ti,1≤i≤|D1|-S+1,從i=1開始,首先找出包含了Ti中任意項(xiàng)的事務(wù)集合,Tj|Tj至少包含了Ti中的一個(gè)項(xiàng)目;j>i),Ti依次與Tj取交集,將兩者的交集移入新的事務(wù)庫D2,同時(shí)剔除Tj,;

(3)對于新事務(wù)庫D2中的事務(wù)T,如果T是由不小于S個(gè)事務(wù)取交集而得,則將T移入最大頻繁候選項(xiàng)集集合MFCS中,同時(shí)剔除T在D2中的子事務(wù);

(4)如果新事務(wù)庫D2中的剩余事務(wù)個(gè)數(shù)小于S,則結(jié)束對事務(wù)庫D2的處理,返回到上層事務(wù)庫;否則,對D2從第1步開始再進(jìn)行此過程;

(5)當(dāng)事務(wù)庫D1中剩余的事務(wù)數(shù)小于S時(shí),即i>|D1|-S+1,結(jié)束對當(dāng)前事務(wù)庫D1的處理;

(6)對MFCS中的項(xiàng)集進(jìn)行合并同時(shí)剔除非最大頻繁項(xiàng)集,最后的結(jié)果即為所求的最大頻繁項(xiàng)集集合MFS;

5)最大頻繁項(xiàng)集歸并:

由于最小支持?jǐn)?shù)的限制,使得MFS中最大頻繁項(xiàng)集規(guī)模較小,而且有些項(xiàng)集之間存在大量的重疊項(xiàng),這些項(xiàng)集代表的賬戶群很可能從屬于同一個(gè)炒作群體,為解決這一問題,使用重疊率來反映兩個(gè)項(xiàng)集之間的相似性,設(shè)項(xiàng)集X1,X2∈MFS,將X1和X2的重疊率記為:

ORate(X1,X2)=|X1X2|Min(|X1|,|X2|)]]>

上式中,|X1∩X2|表示X1與X2重疊項(xiàng)目的個(gè)數(shù),Min(|X1|,|X2|)表示規(guī)模較小的項(xiàng)集中項(xiàng)目的個(gè)數(shù),項(xiàng)集歸并的方法是:

(1)將MFS中的最大頻繁項(xiàng)集按項(xiàng)目的個(gè)數(shù)從大到小排序;

(2)遍歷MFS中的每個(gè)最大頻繁項(xiàng)集,從i=1開始,對,若ORate(Xi,Xj)≥minOR,i<j≤|MFS|,則將Xi和Xj的并集添加到新的集合MMFS中,同時(shí)剔除Xj

(3)對MMFS中的項(xiàng)集重復(fù)執(zhí)行以上兩個(gè)步驟;

(4)當(dāng)MMFS中任意兩個(gè)項(xiàng)集的重疊率小于minOR時(shí),結(jié)束。

3.根據(jù)權(quán)利要求2所述的基于最大頻繁項(xiàng)集挖掘的微博炒作群體發(fā)現(xiàn)方法,其特征在于,所述的步驟1)中,搜集炒作微博樣本應(yīng)符合如下條件:

a、選取轉(zhuǎn)發(fā)數(shù)相對較高的熱門微博;

b、微博發(fā)布時(shí)間跨度<180天;以利于對炒作群體的發(fā)現(xiàn)。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍信息工程大學(xué),未經(jīng)中國人民解放軍信息工程大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410188004.7/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 91黄在线看 | 久久免费精品国产| www色视频岛国| 91国产在线看| 国产欧美二区| 国产精品黑色丝袜的老师| 97精品超碰一区二区三区| 久久免费视频一区二区| 精品国产伦一区二区三区| 综合国产一区| 97人人模人人爽人人喊0| 国产日产欧美一区| 亚洲乱玛2021| 国产88av| 日韩欧美国产高清91| 国产精品九九九九九| 欧美精品在线一区二区| 欧美日韩一卡二卡| 国产精品96久久久| 综合久久色| 亚洲精品国产91| 97精品国产97久久久久久粉红| 日韩欧美中文字幕精品| 国产99久久九九精品| 99爱精品在线| 一区二区三区免费高清视频| 午夜av片| 96国产精品视频| 日韩有码一区二区三区| 欧美日韩一区二区三区在线观看视频| 制服丝袜视频一区| 国产免费一区二区三区四区五区 | 欧美一区二区三区性| 日本一区免费视频| 精品视频久| 国产欧美日韩精品一区二区三区| 久99精品| 国产精品一区二区6| 国产精品免费专区| 欧美中文字幕一区二区三区| 亚洲欧美一二三| 久久精品一二三| 国产精品一区二区av麻豆| 国产综合亚洲精品| 国模一区二区三区白浆| 国产一区二区精华| 日日狠狠久久8888偷色| 99精品久久久久久久婷婷| 国产1区2| 99爱国产精品| 国产精品麻豆一区二区| 亚洲一区2区三区| 亚洲欧美一二三| 日本一区免费视频| 综合欧美一区二区三区| 国产精品九九九九九九| 日韩精品乱码久久久久久| 欧美日韩三区二区| 国产伦精品一区二区三区无广告| 欧美精品久| 亚洲精品乱码久久久久久国产主播| 日本一区二区在线电影| 亚洲一区二区福利视频| 国产乱人激情h在线观看| 欧美精品在线观看视频| 国产91丝袜在线播放动漫| 国产一区影院| 国产麻豆91视频| 国产91久久久久久久免费| 91精品综合| 国产视频二区| 久久午夜鲁丝片| 超碰97国产精品人人cao| 精品三级一区二区| 国产乱码精品一区二区三区中文| 国产精品久久二区| 扒丝袜网www午夜一区二区三区| 午夜大片网| 国产一区二区91| 国产精品视频一区二区在线观看 | 精品视频久| 欧美一区二区三区在线视频观看| 国产精品视频99| 国产91免费在线| 亚洲国产一区二区久久久777| 国产精品影音先锋| 娇妻被又大又粗又长又硬好爽| 日韩女女同一区二区三区| 久久er精品视频| 国产v亚洲v日韩v欧美v片| 美女脱免费看直播| 97人人揉人人捏人人添| 最新国产精品久久精品| 午夜免费网址| 狠狠色丁香久久婷婷综合丁香| 久久99国产综合精品| 538国产精品| 精品国产乱码一区二区三区在线| 欧美亚洲视频二区| 国产一区二区精品免费| 中文字幕欧美日韩一区| 免费超级乱淫视频播放| 免费欧美一级视频| 四虎精品寂寞少妇在线观看| 国产丝袜一区二区三区免费视频| 亚洲午夜精品一区二区三区| 天干天干天啪啪夜爽爽99| 96国产精品| 精品国产一区二区三区高潮视| 国产在线欧美在线| 国产精品一二三区免费| 在线中文字幕一区| 国产1区在线观看| 国产69精品久久久久男男系列| 亚洲欧美日韩综合在线| 国产精品国产亚洲精品看不卡15 | 亚洲国产精品麻豆| 97欧美精品| 午夜肉伦伦| 午夜亚洲影院| 欧美日韩激情在线| 91国产在线看| 欧美亚洲视频二区| 欧美日韩国产精品一区二区三区| 岛国黄色av| 国产性生交xxxxx免费| 四虎国产精品永久在线| 精品国产一区二区三区在线| 国产精品一区二区毛茸茸| 国产精品视频免费看人鲁| 久久久久亚洲精品视频| 中文字幕一区2区3区| 欧美日韩精品不卡一区二区三区| 国产乱人伦偷精品视频免下载| 欧美67sexhd| 欧美日韩国产色综合一二三四| 午夜影院一级片| 色午夜影院| 国产精品一级片在线观看| 北条麻妃久久99精品| av午夜剧场| 日本一区二区三区中文字幕| 亚洲国产日韩综合久久精品| 亚洲欧美日韩另类精品一区二区三区 | 国产欧美一区二区在线| 午夜生活理论片| 久久不卡精品| 国产精品亚洲精品| 国产精品亚洲一区| 日本中文字幕一区| 国产欧美一区二区精品性色超碰| 妖精视频一区二区三区| 亚洲精品久久久久玩吗| 久久久久久久亚洲视频| 狠狠色狠狠综合久久| av午夜在线观看| 亚洲国产99| 欧美一级免费在线视频| 国产女人好紧好爽| 国产足控福利视频一区| 日本福利一区二区| 国产精品刺激对白麻豆99| 年轻bbwbbw高潮| 国产区一区| 久久午夜精品福利一区二区| 天堂av色婷婷一区二区三区| 美女直播一区二区三区| 日韩一区免费在线观看| 日韩av在线中文| 亚洲国产欧美一区二区三区丁香婷| 欧美一区二三区| 亚洲欧美日韩国产综合精品二区| 国产精品入口麻豆九色| 艳妇荡乳欲伦2| 高清国产一区二区三区| 国产69精品久久久久app下载 | free性欧美hd另类丰满| 久久久久久久久亚洲精品一牛| 欧美日韩亚洲国产一区| 911久久香蕉国产线看观看| 日本一区中文字幕| 久久久久亚洲| 肉丝肉足丝袜一区二区三区| 午夜免费片| 国产91白嫩清纯初高中在线| 年轻bbwbbw高潮| 国产日本欧美一区二区三区| 九九热国产精品视频| 性精品18videosex欧美| 国产精品国产三级国产专播精品人| 亚洲欧洲一区二区| 国产理论一区二区三区| 在线国产一区二区三区| 综合在线一区| 97视频久久久| 欧美日韩国产在线一区| 欧美一区亚洲一区| 欧美日韩国产一区在线| 国产精品久久久久久久久久久新郎 | 狠狠色丁香久久婷婷综| 国产欧美www| 久久中文一区| 久久99精品国产麻豆宅宅| 国产乱色国产精品播放视频| 欧美一区二区三区免费在线观看| 欧美精品免费看| 高清欧美精品xxxxx| 日韩精品久久久久久久酒店| 欧美高清极品videossex| 在线播放国产一区| 粉嫩久久99精品久久久久久夜| yy6080影院旧里番乳色吐息| 亚洲欧美日韩国产综合精品二区| 日韩亚洲欧美一区| 欧美日韩国产在线一区二区三区| 中文字幕一区三区| 亚洲精品欧美精品日韩精品| 国产精品高潮呻吟三区四区| 久久精品视频一区二区| 97人人添人人爽一区二区三区| 在线观看欧美日韩国产| 国产一区二区三区乱码| 国产精品乱战久久久| 免费**毛片| 亚洲精品乱码久久久久久按摩| 免费**毛片| 国产精品久久久久久久久久久杏吧| 91超薄丝袜肉丝一区二区| 国产精品视频一二区| 欧美精品八区| 国产在线欧美在线| 国产精品一区二区麻豆| 91麻豆精品国产91久久久久推荐资源| bbbbb女女女女女bbbbb国产| 久久精品亚洲精品| 亚洲国产视频一区二区三区| 国产偷自视频区视频一区二区| www.日本一区| 日本久久不卡| 国产高清在线精品一区二区三区 | 91精品久久久久久| 欧美精品综合视频| 欧洲在线一区| 欧美三区二区一区| 亚洲一区欧美| 国产一区二区三区小说|