日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于狄利克雷多項混合模型的長文本輔助短文本的文本聚類方法有效

專利信息
申請號: 201710504980.2 申請日: 2017-06-28
公開(公告)號: CN107798043B 公開(公告)日: 2022-05-03
發明(設計)人: 黃瑞章;閆盈盈;馬燦;徐立洋;丁志遠;王瑞;黃庭;劉博偉 申請(專利權)人: 貴州大學;貴州耕云科技有限公司
主分類號: G06F16/35 分類號: G06F16/35
代理公司: 北京睿智保誠專利代理事務所(普通合伙) 11732 代理人: 周新楣
地址: 550025 貴州省貴*** 國省代碼: 貴州;52
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 狄利克雷 多項 混合 模型 文本 輔助 方法
【權利要求書】:

1.一種基于狄利克雷多項混合模型的長文本輔助短文本的文本聚類方法,其特征在于,包括如下步驟:

1)將主題相關的長文本集與短文本集進行文本預處理:進行分詞,去停用詞、低頻詞及標點數字;

2)基于狄利克雷多項混合模型構建主題模型:構建得到主題模型,主題模型:給定一個包含L篇長文本和S短篇文章的數據集,每一篇長文本表示為xl,短文本表示為xs;針對長文本,用一個參數為ω伯努利分布生成有用判別詞和無用噪聲詞的標簽二進制向量γ,xl(1-γ)為長文本的無用噪聲部分的表示向量,xlγ為其有用判別部分的表示向量;所有的長文本的無用噪聲表示xl(1-γ)由一個統一的背景主題詞分布φ0產生,其中,φ0由狄利克雷分布λ產生;長文本的有用判別部分和短文本共享主題生成;首先,長文本的有用判別部分和短文本共享其主題分布的先驗參數α,α分別生成長文本集的主題分布θL和短文本集的主題分布θs,長文本主題分布θL中采樣的長文本和短文本的主題zl,短文本集的主題分布θs中采樣的長文本和短文本的主題zs,最終利用主題zl和主題zs,與主題詞分布φ分別產生長文本的有用判別表示向量xlγ和短文本表示xs,其中φ中包含k個主題詞分布φk,φk由共同的狄利克雷分布β產生;;

α表示狄利克雷分布的參數,是一個向量,維度等于主題的個數;β,λ表示狄利克雷分布的參數,維度等于語料庫詞匯總數;ω表示伯努利分布的參數,表示一個詞為有用詞的概率;θL表示長文本集的主題分布;θS短文本集的主題分布;短文本集詞語與長文本集有用詞形成的主題-詞語分布;φ0噪音詞的詞語分布,模型假設長文本中的噪音詞來源于一個主題;zl表示從θL中采樣的長文本和短文本的主題;zs表示從θS中采樣的長文本和短文本的主題;γ伯努利分布的結果,如果γ=1為該詞為有用詞,如果γ=0為該詞為噪音詞;xl,xs分別表示一篇長文本,短文本;L長文本總篇數;S短文本總篇數;K初始化時主題的總數目;

3)模型的參數估計:基于主題模型(1),利用Blocked Gibbs采樣算法,采樣長短文本共同的詞-主題分布,長文本集的主題分布、噪音詞分布,以及短文本的主題分布;

4)根據主題進行聚類:將Blocked Gibbs采樣算法運行1000-2000次后,得到目標短文本的主題分配情況并進行文本聚類;

首先初始化模型參數;需要初始化的模型參數包括超參數{α,β,λ,ω}和隱藏變量{γ,zl,zs};初始化模型參數之后,Blocked Gibbs sampling的推斷過程如下:

1)更新詞類型標識γ;重復下列的Metropolis-Hasting算法R次:從[0,V-1]中隨機選擇一個詞并標識為γold,改變γoldγnew。γnew通過下列概率進行轉移;

其中,P(γ|DL,zl)∝P(DL|γ,zl)·p(γ);P(DL|γ,zl)在上述公式出已給出;

2)更新長文本有用詞和短文本的主題-主題分布φ;對于k={1,2,...,k},如果k不在中,從具有參數β的狄利克雷分布采用φk,否則,從具有如下參數的狄利克雷分布中采樣φk

3)更新長文本燥音詞音分布φ;從具有如下參數的狄利克雷分布中采樣噪音詞分布;

4)更新長文本集分布θL;具有如下參數的狄利克雷參數中采樣主題分布;

其中I(z1=k)是一個標識函數;當z1=k時,I(z1=k)=1;

5)更新短文本集分布θS;從具有如下參數的狄利克雷參數中采樣主題分布:

其中I(zs=k)是一個標識函數;當zs=k時,I(zs=k)=1;

6)更新每篇長文本的主題z1,其中l={1,2,...,L};從離散分布中采樣,其參數是{qsl,...,qsK},滿足:

7)更新每篇短文本的主題zs,其中s={1,2,...,S};從帶有參數{qsl,...,qsK}的離散分布中采樣,其中參數滿足如下條件:

需要注意的是:假設模型估計的類的數目為K*,其值為向量的大小,小于初始化的K值。

2.如權利要求1所述的基于狄利克雷多項混合模型的長文本輔助短文本的文本聚類方法,其特征在于,所述步驟(3)進一步包括下列具體步驟:

首先初始化模型參數,需要初始化的模型參數包括超參數{α,β,λ,ω}和隱藏變量{γ,zl,zs};初始化模型參數之后,Blocked Gibbs sampling的推斷過程如下:

(a)更新詞類型標識γ;

(b)更新長文本有用詞和短文本的主題-主題分布

(c)更新長文本噪音詞分布

(d)更新長文本集分布θL

(e)更新短文本集分布θS

(f)更新每篇長文本的主題zl,其中l={1,2,…,L};

(g)更新每篇短文本的主題zs,其中s={1,2,…,S};

其中,α表示狄利克雷分布的參數,是一個向量,維度等于主題的個數;β,λ表示狄利克雷分布的參數,維度等于語料庫詞匯總數;ω表示伯努利分布的參數,表示一個詞為有用詞的概率;θL表示長文本集的主題分布;θS短文本集的主題分布;短文本集詞語與長文本集有用詞形成的主題-詞語分布;噪音詞的詞語分布,模型假設長文本中的噪音詞來源于一個主題;zl表示從θL中采樣的長文本和短文本的主題z;zs表示從θS中采樣的長文本和短文本的主題;γ伯努利分布的結果,如果γ=1為該詞為有用詞,如果γ=0為該詞為噪音詞;

zl={z1,…,zL}是長文本集中L篇文檔的主題標簽集合,zs={z1,…,zS}是短文本集中S篇文檔的主題標簽集合。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于貴州大學;貴州耕云科技有限公司,未經貴州大學;貴州耕云科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710504980.2/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品白浆视频| 热久久一区二区| 一区二区欧美精品| 午夜三级电影院| 狠狠色噜噜狠狠狠狠色综合久老司机| 国产一区二区三级| 国产精品自拍在线| 久久99视频免费| 妖精视频一区二区三区| 久久午夜精品福利一区二区| 色婷婷综合久久久久中文| 狠狠色噜狠狠狠狠| 女女百合互慰av| 欧美精品在线视频观看| 少妇高潮在线观看| 国产精品久久久麻豆| 久久免费视频99| 久久99亚洲精品久久99| 国产免费一区二区三区四区五区| 国产精品一区二区av日韩在线| 成年人性生活免费看| 欧美一级久久久| 日韩欧美一区二区久久婷婷| 国产午夜精品一区二区三区视频| 日本大码bbw肉感高潮| 国产欧美一区二区精品久久久| 国产一区午夜| 久久一级精品| 91亚洲欧美日韩精品久久奇米色| 欧美亚洲视频一区二区| 91精品视频在线观看免费| 日韩av在线播放观看| 亚洲精品久久久久不卡激情文学| 国产精品久久久久久久久久不蜜月| 日本三级韩国三级国产三级| 99国产精品永久免费视频| 国产理论一区二区三区| ass韩国白嫩pics| 欧美777精品久久久久网| 26uuu亚洲电影在线观看| 欧美高清xxxxx| 欧美在线视频三区| 国产一区二区三区网站| 色综合久久网| 国产二区免费| 国产精品亚洲а∨天堂123bt| 年轻bbwbbw高潮| 国产精品尤物麻豆一区二区三区| 一本一道久久a久久精品综合蜜臀| 国产一区二区激情| 日韩欧美国产中文字幕| 国产欧美一区二区三区免费看| 日韩av一二三四区| 夜夜躁日日躁狠狠躁| 99国产精品9| 午夜影院h| 午夜激情在线播放| 国产在线一区二区视频| 国产精品亚洲一区二区三区| 国产精品96久久久| 狠狠色丁香久久婷婷综合_中| 午夜国产一区| 国产第一区在线观看| 国产黄一区二区毛片免下载| 欧美hdfree性xxxx| 亚洲国产一区二区久久久777| 99国产精品永久免费视频| av午夜在线| 国产在线一卡| 亚洲一二三在线| 欧美精品一级二级| 国内精品久久久久久久星辰影视 | 日韩精品中文字| 亚洲国产精品肉丝袜久久| 国产电影精品一区二区三区| 日韩女女同一区二区三区| 91国偷自产一区二区介绍| 满春阁精品av在线导航 | 日韩av中文字幕一区二区| 国产伦精品一区二| 国产无套精品久久久久久| 91精品久久久久久久久久| 国产精品v欧美精品v日韩| 日韩av中文字幕第一页| 美国三级日本三级久久99 | 国产精品国产一区二区三区四区| 香蕉视频一区二区三区| 欧美二区精品| 国产精品尤物麻豆一区二区三区| 中文乱码在线视频| 丰满少妇高潮惨叫久久久一| 国产精品欧美一区二区三区奶水| 国产va亚洲va在线va| 热久久国产| 亚洲欧美一二三| 国91精品久久久久9999不卡| 久久er精品视频| 亚洲精品日韩在线| 国产精品对白刺激在线观看 | 久久一区二区三区欧美| 久久一区二区三区视频| 日韩中文字幕亚洲欧美| 国产一区欧美一区| 91av中文字幕| 国产品久精国精产拍| 日韩av中文字幕在线| 国产足控福利视频一区| 片毛片免费看| 欧美日韩一区二区三区不卡| 中文字幕日本一区二区| 少妇久久免费视频| 久久久一区二区精品| 国产亚洲精品久久午夜玫瑰园| 26uuu色噜噜精品一区二区| 狠狠色丁香久久综合频道 | 国产在线不卡一区| 欧美日韩国产一区在线| 国产精品久久久久久久综合| 日本一区二区三区在线视频| 日韩亚洲欧美一区| 久久国产精品首页| 国产.高清,露脸,对白| 久久99亚洲精品久久99果| 国产91精品一区二区麻豆亚洲| 97国产婷婷综合在线视频,| 7777久久久国产精品| 欧美日韩中文国产一区发布| 国产日韩区| 国产精品9区| 日韩国产精品久久久久久亚洲| 色偷偷一区二区三区| 蜜臀久久久久久999| 偷拍自中文字av在线| 午夜精品999| 亚洲精华国产欧美| 国产二区视频在线播放| 国产精品一区二区麻豆| 中文字幕在线一区二区三区| 最新国产一区二区| 激情久久久久久| 中文字幕制服狠久久日韩二区| 色噜噜狠狠狠狠色综合久| 理论片高清免费理伦片| 久久影视一区二区| 亚洲麻豆一区| 91福利视频导航| 中文字幕一区一区三区| 久久久久久久国产| 免费精品一区二区三区第35| 国产一区二区极品| 视频一区二区三区欧美| 国产日产高清欧美一区二区三区| 99久久国产综合| 午夜片在线| 国产精品电影一区二区三区| 午夜爱爱电影| 国产一级精品在线观看| 国产一区二区91| 久久精品国产久精国产| 国产一区免费播放| 欧美日本一二三区| 91久久久久久亚洲精品禁果| 夜夜躁狠狠躁日日躁2024| 欧美精品一区二区三区视频| 少妇bbwbbwbbw高潮| 国产精品久久久久久av免费看| 国产精品视频99| 欧美日韩久久一区二区| 日日夜夜一区二区| 91一区二区在线观看| 99精品久久久久久久婷婷| 国产精品视频久久久久| 午夜码电影| 亚洲精品日本无v一区| 欧美极品少妇xx高潮| 91精彩刺激对白露脸偷拍| 黄色国产一区二区| 狠狠搞av| 亚洲国产午夜片| 精品国产区一区二| 国产日韩欧美在线影视| 久久久久久久国产精品视频| 国产精品九九九九九九| 国产精品久久久爽爽爽麻豆色哟哟| 国产69精品久久久久按摩| 一区二区在线精品| 国产精品对白刺激在线观看| 国产精品无码永久免费888| 午夜a电影| 国产黄一区二区毛片免下载| 国产精品国产三级国产aⅴ下载| 国产在线干| 亚洲国产一区二区久久久777| 久久久久久中文字幕| 国偷自产中文字幕亚洲手机在线| 精品久久久久99| 亚洲欧美一卡| 男女午夜影院| 中文字幕国内精品| 欧美日韩一区二区三区不卡| 久久国产精品久久| 久久免费视频99| 国产精品96久久久久久久| 国产91视频一区二区| 少妇厨房与子伦在线观看| 粉嫩久久99精品久久久久久夜| 亚洲国产视频一区二区三区| 亚洲精品日韩激情欧美| 精品国产一区二区三区久久久久久| 欧美日韩国产精品综合| 日本二区在线观看| 精品久久不卡| 国产精品视频免费看人鲁| 一区二区欧美在线| 亚洲精品suv精品一区二区| 欧美在线一区二区视频| 久久国产欧美一区二区三区免费| 亚洲国产精品一区二区久久hs | 亚洲欧美色图在线| 国产精品一区一区三区| 国产精品日韩在线观看| 日韩一级免费视频| 精品国产一二区| 欧美一区二区三区日本| 国产精品一区二区三区在线看| 亚洲日韩欧美综合| 国产在线观看免费麻豆| 精品国产九九| 日本一区二区在线电影| 国产精品1区二区| 亚洲欧美国产日韩综合| 亚洲欧美自拍一区| 国产精品电影一区二区三区| 97人人模人人爽视频一区二区 | 国产精品自产拍在线观看桃花| 狠狠操很很干| 免费看片一区二区三区| 国产高清在线观看一区| 国产伦理精品一区二区三区观看体验 | 久久一级精品| 国产伦精品一区二区三区免费优势| 国产一区日韩精品| 综合国产一区| 欧美在线观看视频一区二区三区| 国产69精品久久| 午夜毛片在线|