日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]基于時序分布信息和主題模型的新聞事件演化分析方法有效

專利信息
申請?zhí)枺?/td> 201410127095.3 申請日: 2014-03-31
公開(公告)號: CN103984681B 公開(公告)日: 2017-01-25
發(fā)明(設(shè)計)人: 王俊麗;王志成;趙衛(wèi)東;王堅(jiān) 申請(專利權(quán))人: 同濟(jì)大學(xué)
主分類號: G06F17/27 分類號: G06F17/27
代理公司: 上海天協(xié)和誠知識產(chǎn)權(quán)代理事務(wù)所31216 代理人: 葉鳳
地址: 200092 *** 國省代碼: 上海;31
權(quán)利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關(guān)鍵詞: 基于 時序 分布 信息 主題 模型 新聞 事件 演化 分析 方法
【說明書】:

技術(shù)領(lǐng)域

發(fā)明涉及文本分析領(lǐng)域,特別涉及到一種新聞事件主題演化分析的方法。

背景技術(shù)

互聯(lián)網(wǎng)時代,信息以爆炸式的速度增長,但是尋找自己真正需要的信息卻變得越來越困難,因此,我們需要新的方法來幫助我們組織和理解這些龐大的信息。主題模型作為一種可以自動組織、理解、搜索和概括大規(guī)模電子文檔的方法,能夠用于挖掘隱藏在文檔集合中的主題信息,然后根據(jù)文檔的主題進(jìn)行標(biāo)記,最后可以根據(jù)標(biāo)記來組織、概括和搜索文本。

主題模型(Topic?Models)的基本思想是,一個文檔是由多個主題混合而成的,而主題是在詞庫上的一個概率分布。主題模型是一個生成式模型,為了生成一個文檔,首先選擇一個主題的概率分布,然后對于文檔的每個詞,根據(jù)主題的概率分布隨機(jī)的選擇一個主題,并從該主題中選擇一個詞。利用統(tǒng)計學(xué)的一個方法,我們可以推理出生成該文檔集合的主題集合。

主題模型的起源是隱性語義索引(Latent?Semantic?Indexing,LSI)。LSI并不是概率模型,因此也算不上一個主題模型,但是其基本思想為主題模型的發(fā)展奠定了基礎(chǔ)。在LSI基礎(chǔ)上,Hofmann(1999;2001)提出了pLSI(Probabilistic?Latent?Semantic?Indexing)模型,但pLSI并沒有用一個概率模型來模擬文檔的產(chǎn)生,只是通過對訓(xùn)練集種的有限文檔進(jìn)行擬合,得到特定文檔的主題混合比例。這樣就導(dǎo)致了pLSI模型參數(shù)隨著訓(xùn)練集中的文檔數(shù)目線性增加,出現(xiàn)過擬合現(xiàn)象,而且對于訓(xùn)練集以外的文檔很難分配合適的概率。2003年,Blei等人pLSI基礎(chǔ)上加以擴(kuò)展,提出了LDA(Latent?Dirichlet?Allocation)模型。LDA模型用服從Drichlet分布的K維隱含隨機(jī)變量表示文檔的主題混合比例,來模擬文檔的產(chǎn)生。Dirchlet分布作為多項(xiàng)分布的共軛先驗(yàn),很好的簡化了統(tǒng)計推理問題。

但是LDA模型假設(shè)語料庫中的所有文檔是可交換的,但是在許多實(shí)際的語料中,該假設(shè)并不合適,如學(xué)術(shù)期刊,郵件,新聞等等的內(nèi)容,都是隨著時間不斷演化的。為了顯示地描述和發(fā)現(xiàn)主題的動態(tài)變化情況,2006年Blei和Lafferty又提出了DTM(Dynamic?Topic?Model)。在DTM模型中,作者按時間片對文檔集合進(jìn)行劃分,然后分別對每個時間片內(nèi)地文檔用LDA模型進(jìn)行建模,而時間片t的主題是從時間片t-1的主題進(jìn)化而來的。

但是DTM模型中,每個時間片內(nèi)的主題數(shù)是確定的,并且所有的主題都是由第一個時間片內(nèi)的主題演變而來,因此該模型比較適合大規(guī)模的涵蓋多個主題的語料庫,這樣的情況下,DTM模型能夠很好的跟蹤每個主題,如何從第一個時間片一步一步演變到最后一個時間片。對于只包含特定新聞事件的語料庫,DTM很難發(fā)現(xiàn)后續(xù)時間片內(nèi)事件的新變化。

發(fā)明內(nèi)容

本發(fā)明目的在于克服現(xiàn)有技術(shù)的不足,公開一種基于時序分布信息和主題模型的新聞事件演化分析方法,本發(fā)明方法將主題模型應(yīng)用到新聞事件的主題跟蹤和演化分析,同時結(jié)合新聞報道在時序上表現(xiàn)出的分布信息,改進(jìn)主題模型在新聞事件跟蹤和演化分析的效果,以更好獲取新聞事件發(fā)展脈絡(luò)。

本發(fā)明方法技術(shù)方案概括為:首先通過分析新聞報道在時間序列上表現(xiàn)出來的分布特征,并利用K-Means聚類算法,將語料庫按時間劃分成幾個子語料庫;然后利用主題模型(LDA)依次對每個子語料庫進(jìn)行主題建模,通過Gibbs抽樣的方法可以將模型學(xué)習(xí)出來,得到每個子語料的主題分布信息;最后通過計算相鄰子語料庫中兩兩主題之間的Jensen-Shannon距離,取距離最小的主題串聯(lián)起來,被串聯(lián)起來的主題便是該事件的主主題,每個子語料中除了主主題之外的輔助主題,便是該事件在各個階段的關(guān)注點(diǎn)和新的發(fā)展。

上述技術(shù)方案,具體包括實(shí)施步驟:

(1)文檔時序分析。通過遍歷某一事件相關(guān)報道的文檔集合,生成報道在時間上的分布信息,即每天各有多少數(shù)量的相關(guān)報道,并在二維空間繪制分布圖,橫軸表示時間,縱軸表示數(shù)量;

(2)通過自適應(yīng)的K-Means算法,將(1)獲得分布數(shù)據(jù)進(jìn)行聚類分析,從而將該事件相關(guān)報道的文檔集合劃分成多個子集合,每個子集合擁有不同的時間跨度,并且在時間上擁有連續(xù)性,即前一個子集合的結(jié)束時間是下一個子集合的開始時間;

(3)文檔預(yù)處理,構(gòu)建新聞演化分析的語料庫。給定關(guān)于某一事件的相關(guān)報道的文檔集合,通過詞性標(biāo)注僅保留名詞(包括專有名詞)、動詞(及其變形)、形容詞(及其變形),去掉停用詞等處理,獲取文檔集合中的有效詞作為語料庫;

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于同濟(jì)大學(xué),未經(jīng)同濟(jì)大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410127095.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說明:

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計專利(升級中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊】

關(guān)于我們 尋求報道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 久久中文一区| 日韩欧美国产第一页| 性欧美一区二区| 欧美一区二区久久久| 夜夜夜夜曰天天天天拍国产| 99久久久久久国产精品| 国产精品久久久久99| 国久久久久久| 久久午夜鲁丝片午夜精品| 91国偷自产一区二区介绍| 久久精品视频一区二区| 欧美片一区二区| 免费91麻豆精品国产自产在线观看| 91精品福利在线| 97国产婷婷综合在线视频,| 日本精品一二区| 99re国产精品视频| 国产精品19乱码一区二区三区 | 一区二区三区国产精品视频| 久久国产精彩视频| 欧美二区在线视频| 国产一区激情| 国产午夜精品一区二区三区最新电影 | 久久久久久久国产| 亚洲第一天堂无码专区 | 国产欧美性| 99久久精品国产系列| 99精品久久久久久久婷婷| 国产欧美一区二区三区免费| 精品久久久久99| 国产一卡在线| 99热久久这里只精品国产www| 欧美日韩亚洲另类| 欧美日韩国产一二三| 欧美色综合天天久久| 中文字幕一区二区三区又粗| 热久久一区二区| 精品国产仑片一区二区三区| 精品国产二区三区| 国产精品美乳在线观看 | 首页亚洲欧美制服丝腿 | 中文字幕日韩有码| 男女无遮挡xx00动态图120秒| 自拍偷在线精品自拍偷无码专区| 日本一区二区三区电影免费观看| 欧美一区二区三区日本| 97国产精品久久| 欧美精品亚洲一区| 久久精品手机视频| 亚洲免费永久精品国产| 美女直播一区二区三区| 国产一区二区免费在线| 久久国产精久久精产国| 亚洲精品日韩在线| 国产suv精品一区二区4| 狠狠色丁香久久综合频道日韩| 国产视频精品一区二区三区| 福利片午夜| 欧美中文字幕一区二区| 久草精品一区| 午夜激情综合网| 九九国产精品视频| 国产精品日韩高清伦字幕搜索| 日本一区二区高清| 国产精品偷伦一区二区| 91麻豆精品国产91久久久更新资源速度超快| 99国产精品9| 国产一区在线视频观看| 久久福利视频网| 国产91在| 国产女人和拘做受在线视频| 69久久夜色精品国产69–| 精品国产乱码久久久久久久久| 鲁一鲁一鲁一鲁一鲁一av| 国产精品19乱码一区二区三区| 一区二区精品久久| 亚洲国产精品一区二区久久hs | 国产日产高清欧美一区二区三区| av素人在线| 日韩精品中文字| 国产视频一区二区在线播放| 91精品福利观看| 中文在线一区| 91麻豆精品国产91久久久更新时间| 国模一区二区三区白浆| 性欧美激情日韩精品七区| 亚州精品中文| 久久99精品久久久大学生| 狠狠色噜噜狠狠狠狠| 日本三级香港三级| av午夜在线| 欧美三级午夜理伦三级中视频| av国产精品毛片一区二区小说| 三级电影中文| 少妇bbwbbwbbw高潮| 亚洲码在线| 亚洲精品丝袜| 97人人模人人爽人人喊38tv| 97国产婷婷综合在线视频,| 97香蕉久久国产超碰青草软件| 久久99精品国产99久久6男男| 国产美女视频一区二区三区| 国产精品99一区二区三区| 国产性猛交| 欧美三区视频| 李采潭伦理bd播放| 99久久国产免费,99久久国产免费大片 | 国产午夜精品一区二区三区最新电影 | 一区二区三区电影在线观看| 粉嫩久久99精品久久久久久夜| 日韩一级视频在线| 国产精品一二二区| 日本一二三区电影| 日本二区在线播放| 免费a级毛片18以上观看精品| 欧美激情午夜| 在线国产一区二区| 国产一区二区三区国产| 日韩av免费网站| 久久久中精品2020中文 | 国产黄色网址大全| 午夜精品在线播放| 欧美一区二区三区免费电影| 国产清纯白嫩初高生在线观看性色| 亚洲国产精品一区在线| 国产色99| 性色av色香蕉一区二区| 精品国产乱码久久久久久久| 国产精品一二二区| 99国产精品99久久久久久粉嫩| 又色又爽又大免费区欧美| 日本精品99| 欧美一区二区三区性| 国产一区日韩欧美| 99热一区二区| 久久99精品久久久大学生| 日韩欧美国产高清91| 国产高清无套内谢免费| 91国产一区二区| 亚洲乱亚洲乱妇28p| 国产999在线观看| 精品国产乱码久久久久久免费| 日本一区二区免费电影| 精品国产二区三区| 狠狠色噜噜狠狠狠四色米奇| 欧美一区二区色| 亚洲理论影院| 99国产精品一区二区| 日韩中文字幕亚洲精品欧美| 久久99精品久久久秒播| 国产日韩欧美91| **毛片免费| 国产一区影院| 欧美三区视频| 99精品久久99久久久久| 最新av中文字幕| 欧美色综合天天久久综合精品| 大bbw大bbw巨大bbw看看| 国产午夜一区二区三区| 国产精品一区在线观看| 三上悠亚亚洲精品一区二区| 久久精品男人的天堂| 日本美女视频一区二区| 亚洲精品无吗| 国产欧美一区二区精品久久久| 午夜wwwww| 午夜wwww| 99国产精品免费| 精品午夜电影| 91人人爽人人爽人人精88v| 国内精品国产三级国产99| 狠狠躁夜夜躁人人爽天天天天97| 日韩精品中文字幕一区二区三区| 国产精品1区2区| 日韩av中文字幕第一页| 欧美国产一区二区三区激情无套| 国产日本一区二区三区| 大bbw大bbw超大bbw| 另类视频一区二区| 欧美亚洲精品suv一区| 欧美高清一二三区| 欧美国产亚洲精品| 日本亚洲国产精品| 国产精品久久久久久久久久嫩草| 日韩欧美国产第一页| 欧美激情在线一区二区三区| 国产精品v欧美精品v日韩| 亚洲美女在线一区| 欧美一区二粉嫩精品国产一线天| 午夜理伦影院| 欧美在线一级va免费观看| 午夜影皖精品av在线播放| 国产精品中文字幕一区| 国产全肉乱妇杂乱视频在线观看| 亚洲乱在线| 欧美一区二区三区性| 国产1区在线观看| 粉嫩久久99精品久久久久久夜| 国产精品精品国内自产拍下载| 欧美亚洲精品一区二区三区| 亚洲精品国产91| 日本精品视频一区二区三区| 久久精品男人的天堂| 国产精品一二三区视频出来一| 国产日韩一区二区在线| 欧美一区二区三区免费在线观看| 亚洲欧美色一区二区三区| 国产不卡网站| 精品久久久久一区二区| 欧美亚洲视频一区二区| 2023国产精品自产拍在线观看| 亚洲国产精品精品| 99视频一区| 国产精品久久久久久久综合| 奇米色欧美一区二区三区| 年轻bbwbbw高潮| 国产一卡二卡在线播放| 91精品美女| 97人人模人人爽人人喊38tv| 国产日韩一区二区三区| 欧美日韩国产精品一区二区三区| 国产日韩一区二区三区| 91久久精品久久国产性色也91| 国产特级淫片免费看| 精品国产乱码久久久久久图片| 欧美日韩国产精品一区二区亚洲| 日本一区二区电影在线观看| 久久99精品久久久久国产越南 | 99久久精品国| 夜夜嗨av禁果av粉嫩av懂色av| 少妇高清精品毛片在线视频| 国内精品久久久久影院日本| 97人人揉人人捏人人添| 国产一二三区免费| 国内精品99| 日韩精品在线一区二区三区| 国产1区2区视频| 久久夜色精品亚洲噜噜国产mv| 午夜影院一区二区| 欧美精品一区久久| 国产91高清| 国产一区二区三区午夜| 精品久久不卡| 91社区国产高清| 偷拍自中文字av在线| 国产精品久久久久免费a∨大胸|