日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于LDA融合模型和多層聚類的新聞話題檢測方法在審

專利信息
申請號: 201710289343.8 申請日: 2017-04-27
公開(公告)號: CN107423337A 公開(公告)日: 2017-12-01
發明(設計)人: 喻梅;安永利;于健;于瑞國;趙滿坤;謝曉東 申請(專利權)人: 天津大學
主分類號: G06F17/30 分類號: G06F17/30;G06F17/27
代理公司: 天津市北洋有限責任專利代理事務所12201 代理人: 劉國威
地址: 300072*** 國省代碼: 天津;12
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 lda 融合 模型 多層 新聞 話題 檢測 方法
【說明書】:

技術領域

發明屬于數據挖掘、自然語言處理和信息檢索領域,涉及監測技術和網絡信息過濾技術,尤其是文本分析和話題檢測方法。具體講,涉及基于潛在狄里克雷分布(Latent Dirichlet Allocation,LDA)融合模型和多層聚類的新聞話題檢測方法。

背景技術

話題檢測與跟蹤(Topic Detection and Tracking,TDT)是早些年從事件的檢測與跟蹤(Event Detection and Tracking,EDT)演變而來,是一項在沒有人工干預的情況下自動對新聞報道進行內容識別、挖掘和組織分類的技術。基于詞頻-反文檔頻率(Term Frequency–Inverse Document Frequency,TF-IDF)的向量空間模型(Vector Space Model,VSM)在文本表示方面展現出強大的能力。向量空間模型是一個用來表示文本文件的代數模型。它應用于信息過濾、信息檢索、索引以及關聯規則。相對于標準布爾數學模型,向量空間模型是基于線性代數的簡單模型,其詞組的權重不是二元的,允許計算文檔和索引之間的連續相似度,允許其根據可能的相關性來進行文檔排序,并且允許局部匹配。

但是空間向量模型也有缺點。空間向量模型不適用于較長的文件,因為它的相似值因為過小的內積和過高的維數而不理想。并且因為基于統計學的出發點使得這種方式忽略了文本語義之間的關聯性,導致語義敏感度不佳。除此之外,其詞組在文檔中出現的順序在向量中無法表示,其權重是直觀上獲得的而不夠正式。

基于單遍聚類算法(Single-Pass)的話題檢測與跟蹤框架為TDT的研究奠定了基礎。Single-pass算法采用增量聚類的方式將文本向量與已有話題內的報道進行比對,計算文本相似度進行匹配。若與某個話題類別匹配,則把該文本歸入該話題,若該文本域所有話題類別的相似度均小于某一閾值,則將該文本表示成新的種子話題。

單遍聚類算法也存在一定缺陷。由于Single-Pass算法對于新聞文本的輸入順序較為敏感,導致當新聞文本的數量不斷提升時,算法的聚類效果卻隨之降低,準確度方面稍有欠缺。文本的層次聚類算法效果好,但是O(n2)的時間復雜度和超高內存耗費制約著該算法。

發明內容

為克服現有技術的不足,本發明旨在提出基于LDA融合模型和多層聚類的新聞話題檢測方法,針對基于TF-IDF向量空間算法語義方面的缺陷,和文本層次聚類時間復雜度和準確度的缺陷,對大量新聞文本的特征提取、表示建模、相似度計算以及快速準確的文本聚類方法進行改進。本發明采用的技術方案是,基于LDA融合模型和多層聚類的新聞話題檢測方法,步驟如下:

步驟一:使用向量空間模型VSM構建相似度模型,VSM模型每一維度表示對應詞的權重向量,對于兩個向量d1、d2,用余弦相似度計算方法計算他們兩者間的相似度,余弦值越是趨向于1,表示兩個向量夾角越大;余弦值趨向于0,也就意味著兩個向量方向越是一致,相似度越高;

步驟二:使用LDA構建主題模型,利用吉布斯Gibbs方法進行抽樣,對模型的各項參數進行計算,通過迭代樣本值方式來實現對于馬爾科夫鏈的構建,并使得其最終達到收斂,最終得到準確的參數設置;

步驟三:將LDA潛在主題模型和VSM空間向量模型結合,在整個聚類算法運行前,通過文本-主題關系矩陣,融合基于TF-IDF權值方法的VSM模型,將VSM模型求得的相似度與LDA模型求得的相似度進行線性表示,并且加權求和得到最終相似度值,使兩種文本模型有機的融合;

步驟四:使用基于單遍聚類算法Single-Pass將文本數據進行VSM建模,特征詞權重賦予的方式采用TF-IDF方法,從而將報道表征成一個一個的向量形式。然后將文檔流與聚類過程中全部話題進行相似度計算,通過將計算的相似度與預先設定的閾值進行對比,判斷該話題是否為新話題;

步驟五:使用ISP聚類算法:在步驟四Single-Pass算法的基礎上增加緩存文檔流,將步驟四相似度中小于預先設定閾值的相似度放到緩存文檔流中,并重新計算相似度,直到所有文檔聚類結束;

步驟六:在步驟五基礎上加入AHC的ISP&AH聚類算法:計算每個文檔之間的相似度,建立一個關于文檔與文檔的相似度矩陣,然后合并矩陣中兩個相似度值最大的文檔為一個話題集合,用這個新的話題類取代被合并的兩個舊的文檔,重新迭代化計算相似度矩陣并再次合并,最終達到滿足停止條件時停止。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津大學,未經天津大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710289343.8/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品理人伦一区二区三区| 色综合久久久| 日韩一级在线视频| 国产精品久久国产三级国电话系列| 一本一道久久a久久精品综合蜜臀 国产三级在线视频一区二区三区 日韩欧美中文字幕一区 | 日本一区欧美| 国产在线干| 久久噜噜少妇网站| 69xx国产| 国产精品亚洲欧美日韩一区在线| 国产欧美日韩va另类在线播放| 精品久久不卡| 久久久久久久久久国产精品| 久久99久国产精品黄毛片入口| 精品国产一区二区三区四区vr| 国产精品免费专区| 亚洲精品一区二区三区98年| 91精品资源| 国产v亚洲v日韩v欧美v片| 一本色道久久综合亚洲精品浪潮| 国产一级自拍片| 狠狠色狠狠色88综合日日91| 91精品视频一区二区三区| 99久久婷婷国产综合精品电影| 天干天干天干夜夜爽av| 国产aⅴ一区二区| 久久久999精品视频| 午夜av资源| 91精品美女| 国产一区www| 国产69精品福利视频| 亚洲w码欧洲s码免费| 亚洲欧美色一区二区三区| 93久久精品日日躁夜夜躁欧美| 国产美女视频一区二区三区| 91精品国产91热久久久做人人| 国产三级国产精品国产专区50| 国产三级精品在线观看| 中文字幕日本一区二区| 日韩亚洲精品视频| 国产又黄又硬又湿又黄| 午夜精品在线播放| 性夜影院在线观看| 亚洲精品卡一卡二| 午夜情所理论片| 狠狠色噜噜狠狠狠狠米奇7777| 69久久夜色精品国产69–| 欧美精品在线不卡| 国产精品香蕉在线的人| 国产人澡人澡澡澡人碰视| 国产69精品久久久久孕妇不能看 | 中文字幕一区二区三区乱码 | 亚洲欧美色图在线| 99久久久久久国产精品| 91精品国产高清一区二区三区| 91久久一区二区| 国产一区二区电影在线观看| 丰满少妇高潮惨叫久久久| 国产69精品久久久久999小说| 日日噜噜夜夜狠狠| 日韩精品中文字幕在线播放| 精品国产区一区二| 97久久精品人人做人人爽50路| 在线中文字幕一区| 狠狠色狠狠色合久久伊人| 欧美视屏一区二区| 国内精品99| 国产一级片子| 中文字幕在线视频一区二区| 538在线一区二区精品国产| 国产精品69久久久| 国产精品96久久久久久又黄又硬| 国产精品日韩一区二区| 国产1区2区3区| 日本高清不卡二区| 久久99精品久久久秒播| 538国产精品一区二区在线| 97香蕉久久国产超碰青草软件| 欧美激情综合在线| 性国产日韩欧美一区二区在线| 欧美日韩三区| 天干天干天干夜夜爽av| 一级午夜影院| 亚洲一二三在线| 午夜av电影网| 亚洲精品久久久中文| 亚洲一二三在线| 久久二区视频| 国产精选一区二区| 亚洲欧美v国产一区二区| 国产aⅴ一区二区| 欧美一区二区久久| **毛片在线| 欧美一区二区三区四区夜夜大片| 久久国产精品网站| 挺进警察美妇后菊| 日本一二三区视频在线| 99久久国产免费| 日韩精品999| 国产精品亚洲第一区| 国偷自产一区二区三区在线观看| 欧美乱妇在线视频播放| 国产视频一区二区三区四区| 久久夜色精品国产亚洲| 欧美国产一区二区在线| 国产精品电影一区二区三区| 国产在线干| 亚洲欧美日韩另类精品一区二区三区| 91精品啪在线观看国产| 欧美激情在线观看一区| 欧美三区视频| 国模精品免费看久久久| 狠狠色噜噜狠狠狠狠黑人| 亚洲欧美另类国产| 亚洲乱码av一区二区三区中文在线:| 日韩久久影院| 99视频国产精品| 99久久国产综合精品麻豆| 欧美日韩国产午夜| 国产精品自拍在线| 激情欧美一区二区三区| 国产二区三区视频| 国产91免费在线| 欧美日韩卡一卡二| 夜夜夜夜曰天天天天拍国产| 在线亚洲精品| 日韩av在线网址| 亚洲一二三在线| 欧美性xxxxx极品少妇| 亚洲午夜天堂吃瓜在线| 97久久精品一区二区三区观看| 强制中出し~大桥未久在线播放| 欧美黄色片一区二区| 香蕉免费一区二区三区在线观看| 亚洲s码欧洲m码在线观看| 一区二区三区四区视频在线| 国产精品9区| av国产精品毛片一区二区小说| 中文字幕区一区二| 性色av香蕉一区二区| 久久人人97超碰婷婷开心情五月| 日本一二三四区视频| 国产一区二区三区午夜| 久精品国产| 欧美精品日韩| 久久久一二区| 免费**毛片| 亚洲欧洲另类精品久久综合| 免费看农村bbwbbw高潮| 性少妇freesexvideos高清bbw| 午夜一区二区三区在线观看| 丝袜诱惑一区二区三区| 少妇高潮ⅴideosex| 国产床戏无遮挡免费观看网站| 色乱码一区二区三在线看| 激情久久影院| 欧美精品第一区| ass美女的沟沟pics| 91国产在线看| 99久久久久久国产精品| 国产精品一区二区毛茸茸| 亚洲欧美国产日韩综合| 午夜av网址| 国产伦精品一区二区三区电影| 国产精品一二三区视频出来一| 免费精品99久久国产综合精品应用| 久久99精品国产麻豆婷婷| 日本精品一区在线| 狠狠插狠狠插| 国产欧美精品一区二区三区-老狼 国产精品一二三区视频网站 | www.成| 国产免费观看一区| 亚洲国产欧美一区| 99久久夜色精品国产网站| 欧美精品在线视频观看| 国产日韩欧美精品一区 | 欧美精品一区二区三区在线四季| 欧美精品国产一区二区| 亚洲欧美另类久久久精品2019| 91看片片| 日本高清二区| 精品久久久久99| 人人澡超碰碰97碰碰碰| 亚洲国产精品97久久无色| 日本精品一区二区三区视频| 曰韩av在线| 免费毛片**| 99精品国产免费久久| 91精品夜夜| 午夜av在线电影| 中文字幕一区三区| 久热精品视频在线| 国产精品爽到爆呻吟高潮不挺| 久久99国产精品久久99| 久久久综合亚洲91久久98| 久久国产中文字幕| 国产日产精品一区二区| 亚洲无人区码一码二码三码| 久久三级精品| 久久精品国产久精国产| 欧美一区二区三区久久综合| 国产一区二区三区小说| 亚洲国产欧美一区二区丝袜黑人| 99国产精品99久久久久久粉嫩| 国产精品一区二区在线看| 欧美精品免费看| 免费xxxx18美国| 中文字幕av一区二区三区高| 四虎国产精品永久在线国在线 | 素人av在线| 国产高清在线一区| 久久免费福利视频| 久久久精品a| 久久精品国产亚洲一区二区| 久久久精品a| 97久久国产精品| 久久久精品免费看| 精品国产1区2区3区| 国产精品一区在线播放| 精品999久久久| 国产高清无套内谢免费| 国产一区二区麻豆| 欧美激情国产一区| 日韩精品免费播放| 国产日韩欧美91| 国产午夜精品一区二区三区四区 | 国产品久久久久久噜噜噜狼狼| 欧美三级午夜理伦三级老人| 午夜诱惑影院| 国产精品免费观看国产网曝瓜| 国产日韩欧美精品一区| 国产精品一二三在线观看| 国产精品尤物麻豆一区二区三区| 国产乱人伦精品一区二区三区| 久99精品| 国产日韩欧美一区二区在线观看| 日本一区二区三区四区高清视频| 亚洲va国产| 亚洲精品suv精品一区二区| 亚洲码在线| 日韩精品免费一区二区夜夜嗨| 国产在线不卡一| 99re国产精品视频| 欧美久久一区二区三区| 国产日韩欧美精品一区| 肉丝肉足丝袜一区二区三区|