日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于分布式多級聚類的話題檢測裝置及方法無效

專利信息
申請號: 201210274779.7 申請日: 2012-08-03
公開(公告)號: CN102831193A 公開(公告)日: 2012-12-19
發明(設計)人: 楊青;李德聰 申請(專利權)人: 人民搜索網絡股份公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京匯澤知識產權代理有限公司 11228 代理人: 劉淑敏
地址: 100020 北京市朝陽*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 分布式 多級 話題 檢測 裝置 方法
【說明書】:

技術領域

發明涉及文本信息處理中的網絡信息分析、文本分類和文本聚類技術,尤其涉及一種基于分布式多級聚類的話題檢測裝置及方法。?

背景技術

隨著互聯網的高速發展,網絡上的信息越來越多元和豐富,與此同時,網絡輿情的社會影響力不斷增強,很多社會熱點事件都是在網絡中第一時間披露和傳播,網絡話題檢測因而愈發顯現出其重要價值。在互聯網環境中,存在大量自然語言形式的文檔,其類型包括新聞、博客、論壇帖子,以及新興的微博等,這些文檔為發現熱點話題提供了最基本的數據來源。?

美國國防部開展的話題檢測與跟蹤項目(TDT,Topic?Detection?and?Tracking)最早展開了該領域的系統性研究。多種TDT技術在該領域已經做出了有益探索。現有話題檢測技術大多串行地處理每個新產生文檔,基于向量空間模型或其他模型,采用單路徑聚類、凝聚層次聚類等聚類算法,考察其與現有話題集合中各話題的相關程度,并決定將其合并入現有話題或將其視為一個新話題。?

然而,由于這些方法采用串行方式處理每一個文檔,一旦面臨較大的數據量,如果不在聚類算法的選擇上采用復雜度較低但效果較差的算法,便難以保證具有實用意義的處理速度。并且,由于沒有采取預先有效降低噪聲的措施,其檢測效果也有待改善。總之,由于網絡環境中新的文檔每時每刻都在大量產生,如何對它們進行即有效又快速的分析,檢測出熱點話題,對現有技術構成了很大挑戰。?

發明內容

有鑒于此,本發明的主要目的在于提供一種基于分布式多級聚類的話題檢測裝置及方法,以解決在互聯網環境中大量文檔快速更新的條件下,話題檢測面臨的檢測效果與時間開銷的尖銳矛盾。?

為達到上述目的,本發明的技術方案是這樣實現的:?

一種基于分布式多級聚類的話題檢測裝置,該裝置主要包括:

新聞采集模塊,用于實時采集網絡新聞,并抽取出結構化信息;

新聞分類模塊,用于對采集的新聞按主題類別進行分類,分發到各個頻道;

話題檢測模塊,分為多個彼此獨立的模塊,每個頻道對應一個模塊,采用并行方式在各頻道內進行多級聚類,計算各話題熱度,并篩選出頻道熱門話題;

話題整合模塊,用于綜合各頻道熱門話題,篩選出全系統的熱門話題。

其中,所述話題檢測裝置進一步包括:?

話題展示模塊,用于將各話題及其相關信息組織成用戶易使用的形式。

一種基于分布式多級聚類的話題檢測方法,該方法包括:?

A、對新聞進行采集的步驟,從各類網站實時采集網絡新聞;

B、對所述新采集的新聞進行分類的步驟,按其主題類別進行自動化分類,每類對應一個頻道,并將分類后的新聞分發到各個頻道的多級聚類模塊中;

C、對各頻道并行地進行多級聚類的步驟;在所述的每個頻道中,對新進入該頻道的新聞抽取特征,再對頻道內全部數據進行多級聚類,將聚類產生的每一個集合或簇作為一個話題;

D、計算所有話題的熱度,篩選出全系統內的熱點話題和每個頻道內的熱點話題。

其中,步驟A具體包括:?

A1、由網絡爬蟲采集目標網站列表中的網頁;

A2、對采集到的原始網頁做頁面分析,抽取出標題、正文、摘要、作者、來源、發表時間、圖片、視頻信息,并組織成結構化信息。

步驟B所述按新聞主題類別進行自動化分類,包括國內、國際、社會、財經、體育、娛樂、汽車、科技和互聯網類,并將所述類別作為相應的頻道。?

步驟B具體包括:?

B1、采用預先專門訓練的樸素貝葉斯分類器,抽取網頁的標題、正文、URL的特征,并結合若干規則,判定本周期內新采集到的各網頁是否屬于新聞,如果是,進一步判定其屬于哪一個頻道;

B2、將新采集到的新聞發送給對應的頻道。

7、根據權利要求3所述的基于分布式多級聚類的話題檢測方法,其特征在于,步驟C所述對各頻道并行地進行多級聚類的步驟,具體包括:?

C1、去除頻道內長時間無變化的話題,以降低后續聚類處理的數據量,避免過時話題對聚類可能造成的干擾;

C2、對當前周期內進入本頻道的各條新聞抽取特征;

C3、對步驟C2中生成的一批特征向量進行層次聚類,聚類算法采用非加權組中心UPGMC算法,在該算法中,聚類結果中的每個集合或簇都擁有一個中心向量;相似度的計算方法為采用兩個簇的中心向量的余弦相似度;

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于人民搜索網絡股份公司,未經人民搜索網絡股份公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210274779.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产一区二区三区精品在线| 在线亚洲精品| 免费的午夜毛片| 精品久久久久久久久亚洲| 7777久久久国产精品| 午夜理伦影院| 日本少妇高潮xxxxⅹ| 999亚洲国产精| 日韩av在线播放观看| 免费午夜在线视频| 国产精品一二三区免费| 久久国产精品久久久久久电车| 久久99精品久久久秒播| 午夜激情在线| 久久久午夜爽爽一区二区三区三州| 欧美一区二区三区三州| 在线国产精品一区| 色综合欧美亚洲国产| 一区二区三区国产精华| 亚洲精品日韩在线| 欧美日韩激情一区| 偷拍久久精品视频| 女女百合互慰av| 91久久综合亚洲鲁鲁五月天 | 国产一区二区日韩| xx性欧美hd| 欧美髙清性xxxxhdvid| 国产欧美久久一区二区三区| 国产精品9区| 国产精品综合在线观看| 久久精品色欧美aⅴ一区二区| 97久久国产精品| 精品久久不卡| 亚洲第一天堂久久| 国产乱人伦精品一区二区三区| 久久国产精品欧美| 91在线一区| 国产真实乱偷精品视频免| 日韩av在线播| xxxx国产一二三区xxxx| 欧美视频1区| 日韩欧美一区精品| 97一区二区国产好的精华液| 日韩欧美国产高清91| 国产91色综合| 午夜免费片| 国产精品视频久久久久久| 国产精品一级片在线观看| 日韩中文字幕在线一区| 欧美在线免费观看一区| 91精品久久久久久久久久| 午夜社区在线观看| 一本大道久久a久久精品| 午夜伦理在线观看| 久久综合伊人77777麻豆最新章节 一区二区久久精品66国产精品 | 91久久香蕉| 日韩精品在线一区二区三区| 日本丰满岳妇伦3在线观看| 久久99国产综合精品| 午夜叫声理论片人人影院| 国产午夜三级一区二区三| 欧美一区二区三区久久| 久久精品99国产精品亚洲最刺激 | 中文字幕亚洲欧美日韩在线不卡| 高清欧美xxxx| 国产欧美日韩二区| 一区二区三区国产精品视频 | 综合欧美一区二区三区| 精品国产一区二区三区久久久久久| 欧美日韩一区二区三区在线观看视频| 综合久久色| av毛片精品| 国产一区二区中文字幕| 国产福利一区在线观看| aaaaa国产欧美一区二区| 午夜黄色大片| 国产午夜三级一二三区| 国产欧美一区二区三区视频| 国产丝袜在线精品丝袜91| 精品欧美一区二区精品久久小说 | 日本精品视频一区二区三区| 欧美精品在线观看视频| 日韩精品免费一区| 日本高清二区| 91区国产| aaaaa国产欧美一区二区| 亚洲国产精品一区在线观看| 激情久久一区| 国产日韩欧美一区二区在线观看| 国产69精品久久久| 精品国产乱码久久久久久虫虫 | 国产无遮挡又黄又爽又色视频| 日韩av在线资源| 午夜叫声理论片人人影院| 91精品一区二区中文字幕| 99国产精品一区二区| 亚洲精品一品区二品区三品区 | 国产高潮国产高潮久久久91| av不卡一区二区三区| 国产大片一区二区三区| 一区二区三区欧美日韩| 69久久夜色精品国产7777| 浪潮av色| 国产乱子一区二区| 96国产精品视频| 久久久久久亚洲精品中文字幕| 国产午夜一区二区三区| 国产精彩视频一区二区| 日韩精品一区二区三区免费观看| 国产日韩欧美专区| 奇米色欧美一区二区三区| 免费观看又色又爽又刺激的视频| 国产日韩欧美另类| 99久久婷婷国产精品综合| 国产精品日韩三级| 欧美一区二区三区久久综合| 久久国产麻豆| 99re热精品视频国产免费| 亚洲精品一品区二品区三品区| 午夜伦全在线观看| 小萝莉av| 又黄又爽又刺激久久久久亚洲精品| 国产精品一级在线| 国产第一区在线观看| 19videosex性欧美69| 91视频一区二区三区| 国产精品欧美久久久久一区二区| 日本少妇高潮xxxxⅹ| 国产69精品久久99不卡解锁版| 日韩精品一区二区三区免费观看| 国语精品一区| 午夜免费av电影| 欧美日韩亚洲三区| 天啦噜国产精品亚洲精品| 欧美日韩中文字幕一区| 精品久久香蕉国产线看观看gif | 久久精品国产精品亚洲红杏| 欧美69精品久久久久久不卡| 四虎国产永久在线精品| 日韩精品久久一区二区| 护士xxxx18一19| 国产免费一区二区三区四区| 大桥未久黑人强制中出| 午夜激情电影院| 91丝袜国产在线观看| 亚洲午夜精品一区二区三区电影院| 日韩亚洲国产精品| 狠狠色狠狠色综合久久第一次| 欧美高清极品videossex| 欧美高清xxxxx| 国产亚洲综合一区二区| 中文在线一区二区三区| 91麻豆产精品久久久| 国产色99| 挺进警察美妇后菊| 天摸夜夜添久久精品亚洲人成| 国产日韩欧美三级| 亚洲欧美日韩另类精品一区二区三区 | 69久久夜色精品国产69–| 久久久久偷看国产亚洲87| 日日夜夜精品免费看| 日本精品视频一区二区三区| 国产精品免费一区二区区| 日韩中文字幕在线一区| 国产麻豆91欧美一区二区| 亚洲欧美国产日韩色伦| 91精品一区在线观看| 国产伦精品一区二区三区免费优势| 国产乱对白刺激视频在线观看| 午夜特级片| 久久99精| 欧美国产精品久久| 国产精品久久久久久久久久久不卡| 午夜精品999| 又黄又爽又刺激久久久久亚洲精品| 国偷自产中文字幕亚洲手机在线| 国产精品日韩精品欧美精品| 欧美精品一级二级| 国产精品二区在线| 玖玖精品国产| 91看片片| 精品福利一区| 久久国产精品波多野结衣| 日韩欧美激情| 国产一区网址| 大bbw大bbw超大bbw| 公乱妇hd在线播放bd| 国产日韩欧美一区二区在线播放| 欧美一区二区三区久久精品视| 亚洲一区二区国产精品| 国产精品一区二区三区在线看| 素人av在线| 国产日韩欧美二区| 97人人揉人人捏人人添| 高清国产一区二区三区| 精品欧美一区二区在线观看| 少妇中文字幕乱码亚洲影视| 99久久精品免费看国产免费粉嫩| 一本久久精品一区二区| 亚洲欧美精品suv| 日本一区欧美| 国产品久久久久久噜噜噜狼狼| 国产美女一区二区三区在线观看| 欧美日韩一区二区三区在线观看视频| 精品国产九九| 91亚洲欧美强伦三区麻豆| 狠狠色噜噜狠狠狠狠| 色乱码一区二区三在线看| 国产一区二区三区中文字幕| 国产午夜一级片| 欧美国产在线看| 99国产精品| 久久第一区| 精品久久9999| 国产免费一区二区三区四区五区| www色视频岛国| 日韩精品乱码久久久久久| 夜夜嗨av禁果av粉嫩av懂色av| 九色国产精品入口| 91一区在线观看| 欧美日韩国产色综合视频| 日韩精品999| 国产91视频一区| 国产乱xxxxx97国语对白| 久久艹国产精品| 蜜臀久久99精品久久久久久网站| 久久久久久久国产精品视频| 91精品国产一区二区三区| 91区国产| 日韩午夜三级| 亚洲欧美国产中文字幕| 国产亚洲精品久久网站| xx性欧美hd| 国产乱人伦精品一区二区| 国模少妇一区二区三区| 国产白丝一区二区三区| 久久国产精品二区| 久久乐国产精品| 91免费国产视频| 亚洲欧洲一区| 日韩欧美国产第一页| 国产精品99久久久久久宅男| 日韩精品免费一区二区夜夜嗨 | 日本一区二区免费电影| 欧美亚洲视频一区二区| 91久久国产露脸精品|