日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于主題共識覆蓋率的網絡社區垃圾信息檢測與過濾方法無效

專利信息
申請號: 201310029853.3 申請日: 2013-01-25
公開(公告)號: CN103092975A 公開(公告)日: 2013-05-08
發明(設計)人: 李石君;湯小月;余偉;楊莎;劉晶;丁永剛;胡亞慧;王凱 申請(專利權)人: 武漢大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 代理人: 薛玲
地址: 430072 湖*** 國省代碼: 湖北;42
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 主題 共識 覆蓋率 網絡 社區 垃圾 信息 檢測 過濾 方法
【說明書】:

技術領域

發明屬于數據質量的研究領域,特別涉及一種基于主題共識覆蓋率的網絡社區垃圾信息檢測與過濾方法。

背景技術

主題共識:根據用戶行為特征研究領域的一項重要結論,網絡社區中針對同一主題進行交流的普通用戶所發布的內容都與該主題相關,而存在不良意圖的用戶則會發布一些與主題無關的內容。J.M.Reagle在其專著《GoodFaith?Collaboration?--The?Culture?of?Wikipedia》中分析指出,網絡社區中發布各自不同觀點的用戶之所以能夠圍繞同一主題成功進行溝通交流,是因為彼此之間具有對該主題的基本共識,并且相信與自己交流的對方也同樣會根據這一基本共識發布回復內容[1]。而行業內最大的網絡共建社區維基百科的發起人JimGiles也承認,維基百科是一個基于主題共識而建立的網站[2]。這些用戶行為特征研究領域的相關成果為本項目提出的方法提供了理論基礎。一般的,在網絡社區中,一個主貼及其對應的所有回復貼應當圍繞著同一主題共識進行交流。

文本內容的特征值與特征向量:一段文本內容可以用它的一些屬性來表示其特征,這些可以用來標識文本內容的特征屬性,被稱為文本內容的特征值[3]。文本所包含的字詞集合、詞頻、詞序等,都屬于該文本內容的特征值。將一段文本內容以一組特征值所組成的特征向量來表示,是利用計算機進行文本挖掘得以實施的基礎。

詞袋算法:詞袋算法是將文本內容用不同詞匯的出現次數組成的向量進行的數學化表示的一種方法[4]。其主要思路是:以全部文本內容中所出現的全部詞匯集合作為詞典,以詞典里各個詞匯在某段文本內容中的出現次數(即詞頻)作為元素,將所有詞匯所對應的元素組合起來成為一個數學向量,使得這個數學向量能夠表示該段文本內容的詞匯與詞頻特征,從而得到這段文本內容的詞頻向量。由于傳統的詞袋算法沒有考慮詞匯之間的順序而導致詞序這一重要文本標識信息丟失,因此本項目將在詞匯單元的基礎上,利用雙詞匯串作為基本的詞袋單元[5],從而在詞袋算法中引入對詞匯順序的考慮,對各段文本內容建立標識更為準確的詞頻向量。此處需要注意的是,在詞袋算法中,由于詞典的大小是固定的,因此即使是不同的文本內容,其對應的詞頻向量長度也是相同的。

文本分類:文本分類,其方法可以歸結為根據待分類數據的某些特征來進行匹配,是數據挖掘相關研究中的一項重要內容。文本分類一般包括了文本的表達、分類器的選擇與訓練、分類結果的評價與反饋等過程,其中文本的表達又可細分為文本預處理、索引和統計、特征抽取等步驟。目前較為通用的文本分類方法是基于機器學習理論的方法。統計學習方法需要一批由人工進行了準確分類的文檔作為學習的材料(稱為訓練集,注意由人分類一批文檔比從這些文檔中總結出準確的規則成本要低得多),再由計算機從這些文檔中挖掘出一些能夠有效分類的規則,這個過程被形象的稱為訓練,而總結出的規則集合常常被稱為分類器。訓練完成之后再對待檢測的文檔進行分類時,便使用這些分類器來進行。主流的機器學習方法包括決策樹[6],Bayes[7],神經網絡,支持向量機(SVM)[8],線性最小平方擬合[9],k-NN,遺傳算法,最大熵[10]等。本項目主要采用支持向量機(SVM)算法來建立文本分類模型,判斷待檢測的文本內容是否為垃圾信息需要過濾。

網絡社區垃圾信息的檢測與過濾:目前的網絡社區垃圾檢測算法一般會考察待發布內容的一些基本特征或者固定模式,如文本的長度、敏感詞數量、作者可信度等。Potthast等人針對編輯內容(包括文本、結構、鏈接、多媒體)和編輯操作(插入、替換及刪除)的特征,采用了邏輯回歸模型來檢測無效的編輯內容[11]。Smets等學者用部分匹配的壓縮模型對Wikipedia社區中一個小時出現的新增內容進行分類,并查驗其中的垃圾信息[12]。而SiChi.Chin等人用的則是統計語言模型[13]。除此之外,West等研究者用到了網頁的meta數據,根據作者的聲譽來估計新發布內容的可信度,其中作者的聲譽是通過發帖頻率、發帖位置和注冊信息來度量的[14]。然而上述檢測方法沒有考慮到同一主題下發帖內容的趨同性,因此,對于那些發布內容與正常發帖相似因而顯得較為隱蔽的垃圾信息,這些方法的檢測準確率和召回率都不高。

參考文獻:

[1]J.M.Reagle.Good?Faith?Collaboration--The?Culture?of?Wikipedia(Web?edition).The?MIT?Press,Cambridge,MA.2011.

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310029853.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美hdfree性xxxx| 久久99国产精品视频| 欧美极品少妇xxxxⅹ| 亚洲一级中文字幕| 国产精品一区亚洲二区日本三区| 69xx国产| 亚洲国产精品精品| 中文字幕欧美另类精品亚洲| 国产日本一区二区三区| 国产亚洲精品久久久456| 国产亚洲精品久久久久久久久动漫| 26uuu亚洲电影在线观看| 国产品久久久久久噜噜噜狼狼| 偷拍久久精品视频| 老太脱裤子让老头玩xxxxx| 日韩精品一区在线观看| 日本神影院一区二区三区| 欧美一级久久精品| 欧美一区二区三区三州| 国产精品欧美久久久久一区二区| 亚洲欧洲国产伦综合| av不卡一区二区三区| 激情aⅴ欧美一区二区三区| 中文字幕另类日韩欧美亚洲嫩草| 欧美一区二区久久久| 麻豆精品久久久| 国产国产精品久久久久| www色视频岛国| 93久久精品日日躁夜夜躁欧美| 久久97国产| 亚洲自偷精品视频自拍| 欧美精品亚洲一区| 亚洲一区欧美| 久久夜色精品久久噜噜亚| 色婷婷噜噜久久国产精品12p| 久久久久久国产一区二区三区| 国产91一区| 亚洲国产一区二区精华液| 欧美久久久一区二区三区| 国产欧美日韩亚洲另类第一第二页| 国产乱人乱精一区二视频国产精品| 精品国产乱码久久久久久软件影片| 日韩精品免费看| 精品国产九九九| 日韩av在线播| 性国产videofree极品| 久久乐国产精品| 午夜av男人的天堂| 久久久精品99久久精品36亚| 国产一区二区中文字幕| 国产精品一区二区毛茸茸| 日本一区二区三区四区高清视频| 狠狠躁夜夜躁| 国产高清在线精品一区二区三区| 97视频一区| 性国产videofree极品| 国产精品色在线网站| 99国产精品久久久久老师| 精品一区二区三区中文字幕| 国产999精品久久久久久绿帽| 99日韩精品视频| 性国产videofree极品| 久久国产精品精品国产| 欧美精品亚洲一区| 欧美老肥婆性猛交视频| 热久久一区二区| 在线国产一区二区| 欧美日韩一级在线观看| 亚洲欧美国产精品va在线观看| 午夜毛片影院| 日本大码bbw肉感高潮| 四虎国产永久在线精品| 麻豆精品国产入口| 26uuu亚洲电影在线观看| 欧美一区二区在线不卡| 国产精品美女久久久免费| 国产99久久久精品视频| 玖玖精品国产| 亚洲国产一区二区精品| 亚洲欧美一区二区三区1000| 国产在线拍偷自揄拍视频 | 激情久久综合| 一级午夜影院| 国产精欧美一区二区三区久久| 国产午夜亚洲精品羞羞网站| 亚洲乱码一区二区| 91久久国产露脸精品国产 | 一级女性全黄久久生活片免费 | 午夜影院5分钟| 色婷婷综合久久久久中文| 97久久精品一区二区三区观看| 国产精品不卡一区二区三区| 欧美一区二区三区爽大粗免费 | 国产乱人伦精品一区二区三区| 日本高清二区| 91精品国产高清一区二区三区 | 久久久久久中文字幕| 日本一二三四区视频| 欧美一区二区色| 国产精品一区二区中文字幕| 91片在线观看| 午夜影院一区二区| 欧美日韩激情一区二区| 久久久久亚洲国产精品| 精品久久久久一区二区| 精品免费久久久久久久苍| av狠狠干| 狠狠色噜噜狠狠狠狠88| 久久99精品国产| 少妇av一区二区三区| 欧美乱大交xxxxx古装| 93久久精品日日躁夜夜躁欧美| 乱子伦农村| 久久天堂国产香蕉三区| 中文字幕av一区二区三区高| 欧美三区视频| 欧美精品在线一区二区| 93久久精品日日躁夜夜躁欧美| 91国偷自产一区二区介绍| 三级电影中文| 国产精品一区二区中文字幕| 欧美精品日韩| 国产91热爆ts人妖在线| 日本午夜一区二区| 97人人澡人人添人人爽超碰| 国产69精品久久久久久野外| 欧美一区二区三区视频在线观看| 一区二区三区中文字幕| 中文字幕在线乱码不卡二区区| 日韩av一区二区在线播放| 99久久精品国产系列| 欧美二区在线视频| 日本二区在线播放| 国产女人好紧好爽| 日韩av在线电影网| 国产女人和拘做受在线视频| 狠狠色噜噜狠狠狠狠黑人| 又黄又爽又刺激久久久久亚洲精品 | 狠狠色噜狠狠狠狠| 欧美大片一区二区三区| 91九色精品| 国产精品国产三级国产专区52 | 国产69精品久久99不卡解锁版 | 999久久久国产| 国产午夜精品免费一区二区三区视频| 国产精品视频久久| 久久综合狠狠狠色97| 国产欧美日韩一级| 玖玖国产精品视频| 欧美高清视频一区二区三区| 国产精品天堂网| 欧美日韩高清一区二区| 国产日韩欧美亚洲综合| 99精品欧美一区二区三区美图| 韩国女主播一区二区| 国产精品一区二区三区在线看| 7777久久久国产精品| 国产综合久久精品| 国产午夜亚洲精品羞羞网站 | 午夜av免费看| 99久久久国产精品免费调教网站| 国产午夜一级一片免费播放| 亚洲国产欧美一区二区丝袜黑人 | 国产性生交xxxxx免费| 国产在线一区不卡| 国产伦理久久精品久久久久| 男女视频一区二区三区| 国产午夜精品理论片| av午夜影院| 九九精品久久| 国产一区二区视频在线| 国产片91| 国产精品1区二区| 91麻豆精品国产自产欧美一级在线观看| 久久国产精彩视频| 四季av中文字幕一区| 国产88av| 午夜电影院理论片做爰| 国产一区在线免费观看| 久久国产欧美日韩精品| 国产精品剧情一区二区三区| 蜜臀久久精品久久久用户群体| 国产日韩欧美第一页| 午夜毛片在线看| 午夜av资源| 日韩中文字幕在线一区二区| 国产亚洲精品久久yy50| 国产在线精品一区| 国产精品一区二区av麻豆| 久久久一二区| 午夜看片网站| 久久一区欧美| 日韩区欧美久久久无人区| 99re热精品视频国产免费| 狠狠色噜狠狠狠狠| 日韩久久精品一区二区三区| 国产精品综合在线| 日韩午夜三级| 右手影院av| 97国产婷婷综合在线视频,| 久久黄色精品视频| 国产精品乱码久久久久久久久| 99久久精品免费看国产免费粉嫩 | 99国产精品9| 国产目拍亚洲精品区一区| 久久综合伊人77777麻豆最新章节| 久久人人97超碰婷婷开心情五月| 国产一区二区三区午夜| 国产精品一区在线播放| 亚洲精品一区,精品二区| 精品国产1区2区3区| 国产一区二区三区午夜| 国产婷婷色一区二区三区在线| 国产经典一区二区| 欧美一区二区综合| 国产亚洲精品久久午夜玫瑰园 | 久久久精品二区| 中文字幕制服丝袜一区二区三区| 一区二区三区在线影院| 国内视频一区二区三区| 亚洲美女在线一区| 国产午夜精品理论片| 欧美极品少妇videossex| 99国产精品| 国产一级片一区二区| 精品国产一级| 欧洲精品一区二区三区久久| av国产精品毛片一区二区小说| 国产精品刺激对白麻豆99| 欧美激情在线免费| 中文字幕制服丝袜一区二区三区| 久久久久国产精品免费免费搜索 | 国91精品久久久久9999不卡| 亚洲精品国产setv| 久久一区二区精品| 日韩精品一二区| 欧美日韩一级二级三级| 视频一区二区中文字幕| 国产一区二区视频在线| 午夜激情看片| 日韩精品免费看| 国产午夜精品一区二区三区在线观看| 久久激情影院| 久久午夜鲁丝片午夜精品| 亚洲精品日韩在线| 亚洲四区在线|