日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種對海量文檔集的層次聚類方法及系統有效

專利信息
申請號: 201611186920.2 申請日: 2016-12-20
公開(公告)號: CN106815310B 公開(公告)日: 2020-04-21
發明(設計)人: 趙淦森;黃曉烽;胡波;楊晉吉;朱佳;唐華;廖智銳;湯庸;林嘉洺;張海明 申請(專利權)人: 華南師范大學
主分類號: G06F16/35 分類號: G06F16/35;G06F16/31
代理公司: 廣州嘉權專利商標事務所有限公司 44205 代理人: 胡輝;鄭澤萍
地址: 510631 *** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 海量 文檔 層次 方法 系統
【權利要求書】:

1.一種對海量文檔集的層次聚類方法,其特征在于,包括步驟:

LDA主題分析步驟,使用LDA模型對文檔集的文檔-詞項矩陣進行分析,進而生成文檔集的文檔-主題分布矩陣和主題-詞項分布矩陣;

Word Embedding模型訓練步驟,對文檔集進行Word Embedding模型的訓練,進而將文檔集的詞典中的每個詞項映射為一個多維向量;

層次主題樹生成步驟,對文檔集進行聚類分析后生成對應的層次主題樹;

文檔層次聚類步驟,基于建立的層次主題樹對文檔集進行層次聚類;

所述層次主題樹生成步驟,具體為:對文檔集的每個LDA主題生成一個主題詞項集,進而對每個主題詞項集進行層次聚類分析后,獲得對應的子層次主題樹,最后將所有子層次主題樹結合起來作為整個文檔集的層次主題樹;

所述層次主題樹生成步驟,具體包括以下步驟:

LDA主題詞項集獲取步驟,基于生成的主題-詞項分布矩陣,針對文檔集的詞典中的每個詞項,將其分配給主題分布值最高的LDA主題,進而為文檔集的每個LDA主題獲得相對應的主題詞項集;

主題詞項集優化步驟,基于Word Embedding模型訓練所獲得的每個詞項的多維向量,對每個LDA主題詞項集進行二分K-means聚類,進而計算聚類生成的兩個簇的凝聚度后,刪除凝聚度值大的簇,將凝聚度值小的簇作為該LDA主題的優化后的主題詞項集;

子層次主題樹生成步驟,利用基于輪廓系數的二分K-means分裂式層次聚類對每個LDA主題詞項集進行層次聚類分析,進而生成對應的子層次主題樹;

層次主題樹生成步驟,將所有子層次主題樹結合起來作為整個文檔集的層次主題樹。

2.根據權利要求1所述的一種對海量文檔集的層次聚類方法,其特征在于,所述子層次主題樹生成步驟,具體包括:

步驟1,利用基于輪廓系數的二分K-means分裂式層次聚類對每個LDA主題詞項集進行層次聚類分析,將每個主題詞項集作為一個簇,進行二分K-means聚類;

步驟2,判斷該簇的層次數是否達到預設的深度,若是,則執行步驟4,反之,執行步驟3;

步驟3,將當前聚類的層次樹結構的所有葉節點對應的簇組成一個簇集合,并計算該簇集合中的每個簇的輪廓系數后,選擇輪廓系數最小的簇進行二分K-means聚類,并返回執行步驟2;

步驟4,獲得當前聚類的層次樹結構作為該LDA主題項對應的子層次主題樹。

3.根據權利要求1所述的一種對海量文檔集的層次聚類方法,其特征在于,所述文檔層次聚類步驟,其具體為:

基于建立的層次主題樹,針對文檔集中的每個文檔,計算其與建立的層次主題樹中的葉子主題的余弦相似度,并將每個文檔分配給最大余弦相似度值所對應的葉子主題,實現對文檔集的層次聚類。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南師范大學,未經華南師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611186920.2/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 国产精品爽到爆呻吟高潮不挺| 日本午夜久久| 性生交大片免费看潘金莲| 国产剧情在线观看一区二区| 日韩精品一区二区免费| 99爱精品视频| 午夜伦理片在线观看| 午夜av网址| 性少妇freesexvideos高清bbw| 欧美一区二区三区视频在线观看| 亚洲精品www久久久| 日本午夜久久| 国产真实乱偷精品视频免| 国产精品一区二| 欧美亚洲国产日韩| 国产精品日韩电影| 欧美色图视频一区| 欧美一区二区三区视频在线观看| 日韩一区免费在线观看| 国产69久久久欧美一级| 日本一区二区三区在线视频| 国产精品不卡在线| 午夜大片男女免费观看爽爽爽尤物| 国产美女视频一区二区三区| 久久国产精品视频一区| 免费看性生活片| 日本一区二区三区在线视频| 男人的天堂一区二区| 91麻豆精品国产综合久久久久久| 国产精品69久久久| 午夜毛片电影| 国产网站一区二区| 久久人人精品| 亚洲高清毛片一区二区| 性欧美一区二区三区| 国产一区二区在线精品| 久久久中精品2020中文| 制服丝袜视频一区| 久久激情综合网| 亚洲国产一区二区精品| 羞羞视频网站免费| 亚洲精品人| 91在线一区二区| 亚洲精品国产主播一区| 欧美一区视频观看| 午夜电影理伦片2023在线观看| 日本一区二区免费电影| 国产亚洲久久| 午夜一区二区视频| 欧美日韩国产一级| 亚洲精品国产精品国产| 99国产精品一区二区| 日韩欧美中文字幕一区| 精品videossexfreeohdbbw| 97精品久久人人爽人人爽| 午夜av在线电影| 99久久久国产精品免费无卡顿| 自拍偷在线精品自拍偷无码专区 | 国产精品高潮呻吟久| 国产日韩精品久久| 久久久人成影片免费观看| 色午夜影院| 国产美女一区二区三区在线观看| 欧美日韩一级二级三级| 日本精品99| 狠狠色很很在鲁视频| 国产精品一区一区三区| 国产精品电影免费观看| 国产呻吟高潮| 日韩精品一区在线观看| 亚洲精品久久在线| 久久99精品久久久久婷婷暖91| 国内视频一区二区三区| 亚洲欧洲一区| 国产欧美久久一区二区三区| 99精品视频免费看| 激情久久影院| 久久99精品国产麻豆婷婷洗澡| 国产九九九精品视频| 国产欧美一区二区在线观看| 91免费国产| 午夜剧场伦理|