日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于分布式多級(jí)聚類的話題檢測(cè)裝置及方法無(wú)效

專利信息
申請(qǐng)?zhí)枺?/td> 201210274779.7 申請(qǐng)日: 2012-08-03
公開(kāi)(公告)號(hào): CN102831193A 公開(kāi)(公告)日: 2012-12-19
發(fā)明(設(shè)計(jì))人: 楊青;李德聰 申請(qǐng)(專利權(quán))人: 人民搜索網(wǎng)絡(luò)股份公司
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 北京匯澤知識(shí)產(chǎn)權(quán)代理有限公司 11228 代理人: 劉淑敏
地址: 100020 北京市朝陽(yáng)*** 國(guó)省代碼: 北京;11
權(quán)利要求書(shū): 查看更多 說(shuō)明書(shū): 查看更多
摘要:
搜索關(guān)鍵詞: 基于 分布式 多級(jí) 話題 檢測(cè) 裝置 方法
【權(quán)利要求書(shū)】:

1.一種基于分布式多級(jí)聚類的話題檢測(cè)裝置,其特征在于,該裝置主要包括:

新聞采集模塊,用于實(shí)時(shí)采集網(wǎng)絡(luò)新聞,并抽取出結(jié)構(gòu)化信息;

新聞分類模塊,用于對(duì)采集的新聞按主題類別進(jìn)行分類,分發(fā)到各個(gè)頻道;

話題檢測(cè)模塊,分為多個(gè)彼此獨(dú)立的模塊,每個(gè)頻道對(duì)應(yīng)一個(gè)模塊,采用并行方式在各頻道內(nèi)進(jìn)行多級(jí)聚類,計(jì)算各話題熱度,并篩選出頻道熱門話題;

話題整合模塊,用于綜合各頻道熱門話題,篩選出全系統(tǒng)的熱門話題。

2.根據(jù)權(quán)利要求1所述的基于分布式多級(jí)聚類的話題檢測(cè)裝置,其特征在于,所述話題檢測(cè)裝置進(jìn)一步包括:

話題展示模塊,用于將各話題及其相關(guān)信息組織成用戶易使用的形式。

3.一種基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,該方法包括:

A、對(duì)新聞進(jìn)行采集的步驟,從各類網(wǎng)站實(shí)時(shí)采集網(wǎng)絡(luò)新聞;

B、對(duì)所述新采集的新聞進(jìn)行分類的步驟,按其主題類別進(jìn)行自動(dòng)化分類,每類對(duì)應(yīng)一個(gè)頻道,并將分類后的新聞分發(fā)到各個(gè)頻道的多級(jí)聚類模塊中;

C、對(duì)各頻道并行地進(jìn)行多級(jí)聚類的步驟;在所述的每個(gè)頻道中,對(duì)新進(jìn)入該頻道的新聞抽取特征,再對(duì)頻道內(nèi)全部數(shù)據(jù)進(jìn)行多級(jí)聚類,將聚類產(chǎn)生的每一個(gè)集合或簇作為一個(gè)話題;

D、計(jì)算所有話題的熱度,篩選出全系統(tǒng)內(nèi)的熱點(diǎn)話題和每個(gè)頻道內(nèi)的熱點(diǎn)話題。

4.根據(jù)權(quán)利要求3所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟A具體包括:

A1、由網(wǎng)絡(luò)爬蟲(chóng)采集目標(biāo)網(wǎng)站列表中的網(wǎng)頁(yè);

A2、對(duì)采集到的原始網(wǎng)頁(yè)做頁(yè)面分析,抽取出標(biāo)題、正文、摘要、作者、來(lái)源、發(fā)表時(shí)間、圖片、視頻信息,并組織成結(jié)構(gòu)化信息。

5.根據(jù)權(quán)利要求3所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟B所述按新聞主題類別進(jìn)行自動(dòng)化分類,包括國(guó)內(nèi)、國(guó)際、社會(huì)、財(cái)經(jīng)、體育、娛樂(lè)、汽車、科技和互聯(lián)網(wǎng)類,并將所述類別作為相應(yīng)的頻道。

6.根據(jù)權(quán)利要求3或5所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟B具體包括:

B1、采用預(yù)先專門訓(xùn)練的樸素貝葉斯分類器,抽取網(wǎng)頁(yè)的標(biāo)題、正文、URL的特征,并結(jié)合若干規(guī)則,判定本周期內(nèi)新采集到的各網(wǎng)頁(yè)是否屬于新聞,如果是,進(jìn)一步判定其屬于哪一個(gè)頻道;

B2、將新采集到的新聞發(fā)送給對(duì)應(yīng)的頻道。

7.根據(jù)權(quán)利要求3所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟C所述對(duì)各頻道并行地進(jìn)行多級(jí)聚類的步驟,具體包括:

C1、去除頻道內(nèi)長(zhǎng)時(shí)間無(wú)變化的話題,以降低后續(xù)聚類處理的數(shù)據(jù)量,避免過(guò)時(shí)話題對(duì)聚類可能造成的干擾;

C2、對(duì)當(dāng)前周期內(nèi)進(jìn)入本頻道的各條新聞抽取特征;

C3、對(duì)步驟C2中生成的一批特征向量進(jìn)行層次聚類,聚類算法采用非加權(quán)組中心UPGMC算法,在該算法中,聚類結(jié)果中的每個(gè)集合或簇都擁有一個(gè)中心向量;相似度的計(jì)算方法為采用兩個(gè)簇的中心向量的余弦相似度;

C4、對(duì)上述步驟C3中產(chǎn)生的每一個(gè)簇,找出與該簇的相似度最大的話題;相似度的計(jì)算方式仍為取余弦相似度;

C5、對(duì)本頻道內(nèi)所有話題再進(jìn)行一次UPGMC層次聚類,聚類結(jié)果的所有簇即為本周期結(jié)束后本頻道內(nèi)的全部話題。

8.根據(jù)權(quán)利要求7所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟C2還包括:

首先對(duì)新聞的標(biāo)題和正文進(jìn)行分詞、詞性標(biāo)注、去停用詞、專名識(shí)別、同義詞歸并,處理的結(jié)果以詞或短語(yǔ)為單位,統(tǒng)稱為token,對(duì)每個(gè)token,計(jì)算其TF.IWF分值作為基礎(chǔ)權(quán)重,并結(jié)合其在文中的位置、詞性、專名類型信息,確定其最終的權(quán)重;然后再將token及其分值構(gòu)造成一個(gè)基于向量空間模型的特征向量,用以描述該新聞。

9.根據(jù)權(quán)利要求7所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟C4還包括:

如果該相似度大于預(yù)定閥值,將該簇合并到該話題中,并修正其中心向量和更新時(shí)間;否則,將該簇被視為一個(gè)新的話題,其誕生時(shí)間和更新時(shí)間均為系統(tǒng)當(dāng)前時(shí)間。

10.根據(jù)權(quán)利要求3所述的基于分布式多級(jí)聚類的話題檢測(cè)方法,其特征在于,步驟D具體包括:

D1、對(duì)每個(gè)頻道內(nèi)的話題,依據(jù)其所含新聞的數(shù)量及其發(fā)表時(shí)間分布、話題的誕生時(shí)間、更新時(shí)間的因素綜合計(jì)算,得出其熱度;

D2、再于頻道內(nèi)對(duì)各話題按熱度排序,從而篩選出各頻道內(nèi)的熱門話題;

D3、最后對(duì)整個(gè)系統(tǒng)內(nèi)的話題按熱度排序,篩選出全系統(tǒng)熱門話題,展示給用戶。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于人民搜索網(wǎng)絡(luò)股份公司,未經(jīng)人民搜索網(wǎng)絡(luò)股份公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210274779.7/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書(shū);

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 亚日韩精品| 欧美日韩一区二区三区在线播放 | 日韩区欧美久久久无人区| 黄色香港三级三级三级| 一区二区国产精品| 91麻豆精品国产自产欧美一级在线观看| 国产一区二区免费在线| 日韩精品免费一区二区中文字幕 | 99国产精品欧美久久久久的广告| 欧美日韩一级二级| 日韩欧美多p乱免费视频| 久久99国产视频| 国产videosfree性另类| 综合在线一区| 91精品国产一区二区三区| 欧美在线视频一二三区| 亚洲欧美色图在线| 国产精品一二三区视频出来一| 日韩精品一区在线视频| 欧美一区免费| 国产高清一区二区在线观看| 91夜夜夜| 国产一区二区极品| 日本高清二区| 夜夜爽av福利精品导航| 999亚洲国产精| 日日夜夜精品免费看| 国产色一区二区| 日本一区二区三区免费播放| 久久精品—区二区三区| 国产精品一二三区视频出来一| xxxx18hd护士hd护士| 欧美日韩一区二区三区不卡| 亚洲精品中文字幕乱码三区91| 午夜剧场一级片| 国产一区观看| 少妇高潮在线观看| 日本一区午夜艳熟免费| 躁躁躁日日躁网站| 国产91精品高清一区二区三区| 久久五月精品| 亚洲码在线| 久久久精品观看| 国产精品久久久久久久久久嫩草| 免费看农村bbwbbw高潮| 国产精品午夜一区二区三区视频| 97国产精品久久久| 国产精品视频久久久久久| 欧洲在线一区| 国产午夜精品一区二区三区四区| 久久久精品欧美一区二区免费| 好吊色欧美一区二区三区视频| 国产精品色婷婷99久久精品| 国产88av| 久久久久久久亚洲视频| 国产激情视频一区二区| 四虎影视亚洲精品国产原创优播| 香蕉av一区二区三区| 欧美中文字幕一区二区| 国产乱一乱二乱三| 亚洲国产欧美国产综合一区| 国产精品v亚洲精品v日韩精品| 91麻豆精品国产91久久久无限制版| 国产.高清,露脸,对白| 狠狠躁夜夜躁2020| 国产一级片大全| 国产69精品久久久久999天美| 躁躁躁日日躁网站| 午夜精品一区二区三区在线播放| 午夜剧场a级片| 国产高清在线观看一区| 99精品欧美一区二区三区美图| 国产亚洲精品久久777777| 男女午夜爽爽| 国产午夜精品一区| 国产九九九精品视频| 国产一卡二卡在线播放| 亚洲国产精品一区在线| 国产大片一区二区三区| 国产精品videossex国产高清| 国产一区二区91| 综合久久一区二区三区| 免费视频拗女稀缺一区二区| 欧美网站一区二区三区| 日韩精品一区二区不卡| 欧美一区二区三区黄| 国产精品欧美久久| 欧美日韩精品影院| 日本精品99| 99国产超薄丝袜足j在线观看| 精品国产一区二区三区四区vr| 91看片淫黄大片91| 久久99久久99精品蜜柚传媒 | 国产一区在线精品| 亚洲区在线| 国内揄拍国产精品| 日韩av在线免费电影| 国产91视频一区| 福利电影一区二区三区| 在线视频不卡一区| 国产一区二区三区伦理| 亚洲第一天堂无码专区| 国产极品美女高潮无套久久久| 国产偷自视频区视频一区二区| 亚洲女人av久久天堂| 亚洲欧洲日韩av| 婷婷嫩草国产精品一区二区三区| 午夜特级片| 国产性猛交| 一本色道久久综合亚洲精品浪潮| 一区二区在线国产| 日韩精品一区二区三区不卡| 国产欧美日韩一级大片| 国产一区二区片| 91av中文字幕| 天天干狠狠插| 中文字幕欧美一区二区三区| 国产精品丝袜综合区另类| 97午夜视频| 4399午夜理伦免费播放大全| 国产一区二区视频播放| 91麻豆精品国产综合久久久久久| 日韩精品免费看| 日韩欧美视频一区二区| 少妇**毛片| 亚洲精品一区,精品二区| 精品久久久久一区二区| 亚州精品国产| 亚洲一二区在线观看| 国产欧美日韩精品一区二区图片| 亚洲精品国产主播一区| 欧美日韩一区二区三区不卡| 热久久一区二区| 99国产精品免费观看视频re| 国产精品国产三级国产播12软件| 久久久精品a| 国产88在线观看入口| 最新日韩一区| 99久久国产综合精品色伊| 国产女性无套免费看网站 | 大bbw大bbw巨大bbb| 一区二区三区四区国产| 亚洲国产欧美国产综合一区| 国产精品国产三级国产专区52| 久久精品国产色蜜蜜麻豆| 国产精品第56页| 亚洲精品456| 亚洲精品久久在线| 日本一区二区欧美| 亚洲乱强伦| 中文字幕一区二区三区乱码视频 | 午夜wwww| 激情欧美一区二区三区| 亚洲国产一区二区久久久777| 激情欧美一区二区三区| 91热国产| 国产福利一区在线观看| 精品国产乱码久久久久久图片| 国产理论一区| 欧美乱妇高清无乱码免费| 午夜av网址| 国产欧美精品va在线观看| 国产二区不卡| 久久一区欧美| 亚洲日韩aⅴ在线视频| 日韩亚洲欧美一区二区| 国产午夜亚洲精品午夜鲁丝片| 午夜影院91| 久久久中精品2020中文| 夜夜躁狠狠躁日日躁2024| 久99久精品| 91亚洲精品国偷拍自产| 国产精品天堂| 国语对白老女人一级hd| 亚洲精品456| 香蕉av一区| 国产91白嫩清纯初高中在线| 欧美日韩一区在线视频| 国产一级片一区| 国产日韩欧美亚洲综合| 欧美精品一区久久| 亚洲四区在线| 欧美一级免费在线视频| 国产性猛交xx乱| 国产一区第一页| 久久艹国产精品| 欧美一区二区在线不卡| 午夜免费网址| 波多野结衣女教师30分钟| 正在播放国产一区二区| 国产精品乱综合在线| 午夜激情影院| 91午夜精品一区二区三区| 国产一区在线视频观看| 中文字幕一区二区三区又粗| 国产中文字幕一区二区三区| 午夜av片| 浪潮av网站| 国产精品一区二| 狠狠色狠狠色综合日日五| 欧美一区免费| 99精品小视频| 日韩欧美激情| 精品福利一区| 男女无遮挡xx00动态图120秒| 在线精品国产一区二区三区88| 国产精品九九九九九| **毛片在线免费观看| 欧美乱战大交xxxxx| 一区二区三区欧美在线| 九色国产精品入口| 精品久久久影院| 97精品国产97久久久久久免费| 奇米色欧美一区二区三区| 日韩精品中文字幕一区二区三区| 国产精品视频1区| 少妇高潮大叫喷水| 日韩一区二区福利视频| 理论片午午伦夜理片在线播放| 中文乱幕日产无线码1区| 狠狠躁日日躁狂躁夜夜躁av| 99国产午夜精品一区二区天美| 在线观看欧美一区二区三区| 一区二区三区欧美日韩| 国产一区二区三区黄| 久久久精品久久日韩一区综合| 91精品综合| 亚洲va国产2019| 日韩精品一区中文字幕| 99久久国产综合精品色伊| 91av一区二区三区| 国久久久久久| 少妇久久免费视频| 亚洲一区二区三区加勒比| 精品久久国产视频| 亚洲无人区码一码二码三码 | 亚洲欧美日韩视频一区| 亚洲欧美另类久久久精品2019| 精品国产一区二区三区免费 | 亚洲欧美一卡| 亚洲国产精品网站| 国产男女乱淫视频高清免费| 国产精品理人伦一区二区三区| 午夜无遮挡| 91免费视频国产| 国产无套精品久久久久久|