日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]文本聚類方法、裝置及電子設備在審

專利信息
申請號: 201710083729.3 申請日: 2017-02-16
公開(公告)號: CN106844748A 公開(公告)日: 2017-06-13
發明(設計)人: 谷瓊;王賢明;寧彬;王毅;丁函;曹文平;吳釗;華麗;胡春陽;屈俊峰 申請(專利權)人: 湖北文理學院
主分類號: G06F17/30 分類號: G06F17/30;G06K9/62
代理公司: 北京超凡志成知識產權代理事務所(普通合伙)11371 代理人: 吳開磊
地址: 441000 湖*** 國省代碼: 湖北;42
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文本 方法 裝置 電子設備
【說明書】:

技術領域

發明涉及文本挖掘技術領域,具體而言,涉及一種文本聚類方法、裝置及電子設備。

背景技術

顧名思義,聚類即按照某些特征和規則將整個數據集分成若干組的過程,各個組內元素在某些特征方面具有較高的相似性,而組間元素則在這些特征方面具有較大的差異性,所得到的各個組即為一個聚類,也常稱之為“簇”。目前,文本聚類方法有劃分聚類、層次聚類、基于密度的聚類、基于語義的聚類以及基于各種模型理論的聚類。

上述聚類方法大多需要分詞或特征項支撐,因而決定了特征選擇或降維是一項重要的研究內容。對中文、維吾爾文等語言而言,往往離不開分詞的支持,相應的分詞準確性和速度問題也隨之而來,最終也將影響聚類的速度、準確率和召回率。

發明內容

有鑒于此,本發明的目的在于提供一種文本聚類方法、裝置及電子設備,以解決上述問題。

為實現上述目的,本發明提供如下技術方案:

本發明較佳實施例提供一種文本聚類方法,所述方法包括:

將多個不同主題的原始文檔集合并為一個文檔并集;

將所述文檔并集中的文檔進行升序排列,得到升序文檔并集;

依次計算所述升序文檔并集中的第一個文檔與所述第一個文檔之后的所有文檔的相似度,若計算出的相似度大于或等于第一閾值,將該文檔與所述第一個文檔歸屬于一類,若計算出的相似度小于所述第一閾值,則將該文檔記為未歸類文檔;

依次計算所述升序文檔并集中未歸類文檔中第一個文檔與該第一個文檔之后的所有未歸類文檔的相似度,若計算出的相似度大于或等于所述第一閾值,將該未歸類文檔與所述未歸類文檔中第一個文檔歸屬于一類,若計算出的相似度小于所述第一閾值,則跳過該未歸類文檔,直到完成所述升序文檔并集中最后兩個未歸類文檔的相似度計算及分類,從而得到多個初始聚類。

優選地,所述方法還包括:

過濾掉所有文檔數小于第二閾值的初始聚類,得到多個過濾聚類。

優選地,所述方法還包括:

對所述過濾聚類進行聚類合并,得到多個最終聚類,其中,所述最終聚類與所述原始文檔集相對應,即所述最終聚類的個數與原始文檔集的個數相同,所述最終聚類的主題與原始文檔集的主題相同。

優選地,所述對所述過濾聚類進行聚類合并,得到多個最終聚類的步驟包括:

獲取每個過濾聚類的標志文檔;

將每個過濾聚類的標志文檔進行聚類分析,若兩個標志文檔歸屬于一類,則合并這兩個標志文檔所在的過濾聚類,得到多個最終聚類。

優選地,所述方法還包括:

采用正確覆蓋率評價各個最終聚類的準確率,其中,最終聚類的正確覆蓋率的計算公式為其中,Pk表示與Dk原始文檔集對應的最終聚類的正確覆蓋率,nk表示Dk原始文檔集內文檔的個數,q表示與Dk原始文檔集對應的最終聚類中正確文檔的個數。

優選地,所述方法還包括:

采用F值綜合評價各個最終聚類,其中,最終聚類的F值的計算公式為其中,R表示最終聚類的召回率,a表示最終聚類的召回率的權系數。

優選地,所述相似度的計算公式為其中W(ek)是元素ek的權重評價函數,di和dj表示升序文檔并集中兩個待進行相似度計算的文檔。

本發明另一較佳實施例提供一種文本聚類裝置,包括:

合并模塊,用于將多個不同主題的原始文檔集合并為一個文檔并集;

升序模塊,用于將所述文檔并集中的文檔進行升序排列,得到升序文檔并集;

聚類模塊,用于依次計算所述升序文檔并集中的第一個文檔與所述第一個文檔之后的所有文檔的相似度,若計算出的相似度大于或等于第一閾值,將該文檔與所述第一個文檔歸屬于一類,若計算出的相似度小于所述第一閾值,則將該文檔記為未歸類文檔;以及

依次計算所述升序文檔并集中未歸類文檔中第一個文檔與該第一個文檔之后的所有未歸類文檔的相似度,若計算出的相似度大于或等于第一閾值,將該未歸類文檔與所述未歸類文檔中第一個文檔歸屬于一類,若計算出的相似度小于所述第一閾值,則跳過該未歸類文檔,直到完成所述升序文檔并集中最后兩個未歸類文檔的相似度計算及分類,從而得到多個初始聚類。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖北文理學院,未經湖北文理學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710083729.3/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 中文字幕一二三四五区| 艳妇荡乳欲伦2| 丰满少妇高潮惨叫久久久| 色一情一乱一乱一区99av白浆| 久久艹国产精品| 欧美在线一区二区视频| 日韩一区免费| 日韩区欧美久久久无人区| 99国产精品99久久久久久粉嫩| 亚洲国产精品激情综合图片| 欧美黄色片一区二区| 国产精品伦一区二区三区级视频频| 国产精品电影一区二区三区| 欧美三级午夜理伦三级老人| 国产免费一区二区三区网站免费| 91黄在线看 | 国产一二区在线观看| 99er热精品视频国产| 亚洲精品国产精品国自产网站按摩| 国产精品1区2区| 色噜噜狠狠狠狠色综合久| 国产性生交xxxxx免费| 野花社区不卡一卡二| 国产激情视频一区二区| 久久99精品国产一区二区三区| 最新国产一区二区| 电影91久久久| 狠狠色依依成人婷婷九月| 久久精品视频3| 99精品偷拍视频一区二区三区| 国产一区二区三区四区五区七| 偷拍区另类欧美激情日韩91| 国产一区二区精品在线| 日韩欧美国产精品一区| 亚洲精品乱码久久久久久写真| 午夜爱爱电影| 亚洲乱码av一区二区三区中文在线: | 亚洲国产欧美一区二区丝袜黑人 | 亚洲乱强伦| 国产一区二区三区四区五区七| 国产精品69久久久| 亚洲国产精品日韩av不卡在线 | 91免费看国产| 亚洲美女在线一区| 国产精品1区二区| 狠狠色噜噜狠狠狠狠2021天天| 亚洲精品乱码久久久久久写真| 麻豆精品国产入口| 久久久久国产一区二区三区不卡| 亚洲精欧美一区二区精品| 99精品视频免费看| 男女视频一区二区三区| 午夜666| 国产原创一区二区| 最新国产一区二区| 久久噜噜少妇网站| 欧美一区二区三区黄| 亚洲va国产| 久久99精品国产一区二区三区| 挺进警察美妇后菊| 国产精品免费一视频区二区三区 | 国产一二区在线| 国产精品麻豆一区二区| 99国产伦精品一区二区三区| 午夜免费网址| 国产精品久久久久久久久久久不卡| 欧美精品第一区| 久久午夜无玛鲁丝片午夜精品| 夜夜夜夜曰天天天天拍国产| 久久99精品久久久久婷婷暖91| 久久夜色精品亚洲噜噜国产mv| xxxxx色| 在线国产二区| 午夜电影理伦片2023在线观看| 欧美性二区| 91偷拍网站| 欧美三级午夜理伦三级老人| 日韩欧美中文字幕一区| 亚洲精品久久久久中文第一暮| 中文字幕一区二区三区免费| 国产69精品福利视频| 午夜av男人的天堂| 夜夜嗨av一区二区三区中文字幕| 国产精品乱码一区二区三区四川人| 毛片大全免费观看| 欧美老肥婆性猛交视频| 亚洲国产欧美一区| 亚洲s码欧洲m码在线观看| 欧美一区二区三区久久精品| 国产性猛交96| 欧美一区二区三区白人| 午夜电影一区| 日韩欧美一区精品| 久久狠狠高潮亚洲精品| 亚洲国产欧美一区二区丝袜黑人| 国产在线一区二区视频| 久久精品一二三四| 国产99久久九九精品免费| 国产欧美一区二区精品久久| 91黄在线看| 午夜影院激情| 日韩一级精品视频在线观看| 色偷偷一区二区三区| 日本精品99| 日韩av在线影视| 综合久久国产九一剧情麻豆| 欧美一区二三区人人喊爽| 狠狠色噜噜狠狠狠合久| 精品久久久久久中文字幕| 丰满岳妇伦4在线观看| 日本一级中文字幕久久久久久| 国产精品理人伦一区二区三区| 思思久久96热在精品国产| av国产精品毛片一区二区小说| 激情久久精品| 国产精品久久久久99| 午夜码电影| 国产呻吟久久久久久久92| 午夜电影一区二区| 免费看欧美中韩毛片影院| 国产农村乱色xxxx| 97午夜视频| 456亚洲精品| 日韩精品免费一区二区三区| 人人澡超碰碰97碰碰碰| 国产精品白浆一区二区| 国产一区www| 久久九精品| 日本午夜久久| 日韩av不卡一区| 久久99久久99精品免观看软件 | 欧美午夜羞羞羞免费视频app| 狠狠色噜噜狠狠狠狠69| 欧美精品亚洲一区| 国产亚洲另类久久久精品 | av毛片精品| 精品国产乱码久久久久久图片| 久久久精品欧美一区二区| 国产激情视频一区二区| 久久免费福利视频| 日韩av电影手机在线观看| 激情久久一区二区三区| 久久久久国产亚洲| xxxxx色| 狠狠色狠狠色综合日日五| 国产精品二区一区二区aⅴ| 国产精品一区二区免费| 欧美一区二区伦理片| 精品福利一区二区| 国产理论一区二区三区| 亚洲精品www久久久久久广东 | 久爱视频精品| 国产精品国精产品一二三区| 国产精品天堂| 国产视频一区二区三区四区| av不卡一区二区三区| 99久久精品免费看国产交换| 欧美一区二区三区四区在线观看| 精品99在线视频| 国产精品香蕉在线的人| 99国产精品99久久久久久粉嫩| 中文字幕日韩有码| 亚洲欧美日韩一级| 欧美髙清性xxxxhdvid| 乱淫免费视频| 久久激情网站| 午夜天堂电影| 午夜av资源| 亚洲国产日韩综合久久精品| 欧洲在线一区| 一区二区三区日韩精品| 国产偷久久一区精品69| 久久噜噜少妇网站| 国产v亚洲v日韩v欧美v片| 国产精品乱综合在线| 免费91麻豆精品国产自产在线观看| 99精品小视频| 欧美日韩国产在线一区| 狠狠色综合欧美激情| 精品久久国产视频| 久久激情网站| 麻豆国产一区二区| 精品婷婷伊人一区三区三| 欧美一区二区三区四区在线观看| 国产精品对白刺激久久久| 国产精品久久久久久久新郎| 一区二区国产精品| 狠狠色噜噜狠狠狠狠视频| 国产精品电影一区二区三区| 免费91麻豆精品国产自产在线观看| 岛国精品一区二区| 99久久夜色精品| 欧美性受xxxx狂喷水| 欧美一区二区三区久久久| 在线国产精品一区| 88国产精品视频一区二区三区| 人人要人人澡人人爽人人dvd| 91精品系列| 欧洲在线一区二区| 精品在线观看一区二区| 少妇高潮大叫喷水| 亚洲精品日本无v一区| 欧美日韩亚洲三区| 国产欧美日韩一级| 日日夜夜精品免费看| 久久久久国产精品视频| 国产精品二区一区二区aⅴ| 日本一二三区视频| 久久久99精品国产一区二区三区| 国产精品第56页| 国产亚洲精品综合一区| 亚洲高清毛片一区二区| 国产真实一区二区三区| 一本大道久久a久久精品| 91视频一区二区三区| 亚洲五码在线| 黄色av免费| 亚洲乱强伦| 国产精品剧情一区二区三区| 狠狠色狠狠色综合日日五| 国产精品偷乱一区二区三区| 中文字幕日韩有码| 午夜三级电影院| 午夜伦情电午夜伦情电影| 综合久久国产九一剧情麻豆| 亚洲精品久久久中文| 少妇精品久久久久www蜜月| 午夜老司机电影| 午夜爱爱电影| 玖玖爱国产精品| 国产亚洲精品久久久久久网站| 亚洲一区二区国产精品| 久99久视频| 国产精品一区不卡| 一区二区三区国产欧美| 欧美乱码精品一区二区 | 中文在线√天堂| 国产高清一区在线观看| 一区二区久久精品| 日本一区中文字幕| 久久国产精品欧美| 国产91丝袜在线熟| 国产91精品一区| 中文字幕日韩有码| 精品少妇一区二区三区免费观看焕| 国产在线拍偷自揄拍视频|