日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]基于中心法的自適應文本聚類算法有效

專利信息
申請號: 201410014995.7 申請日: 2014-01-14
公開(公告)號: CN103699695B 公開(公告)日: 2017-02-01
發明(設計)人: 歐陽繼紅;周曉堂;李熙銘;馬超;王旭 申請(專利權)人: 吉林大學
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 長春市四環專利事務所(普通合伙)22103 代理人: 郭耀輝
地址: 130012 吉*** 國省代碼: 吉林;22
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 基于 心法 自適應 文本 算法
【說明書】:

技術領域

發明屬于信息檢索領域,尤其涉及一種基于中心法并自適應確定聚類個數的文本聚類算法。

背景技術

文本聚類算法是機器學習、信息檢索等領域中一類主要的文本數據挖掘方法,是解決互聯網文本信息過載的主要途徑之一。其目的是按照“物以類聚”的原則組織互聯網文本集合,以得到一系列有意義的文本子集。其中,每個文本子集內的文本之間最大程度地相似,而不同文本子集的文本之間最大程度地不同。良好的文本聚類算法能夠將同話題同種類的文本聚集成一個有意義的文本子集,可以幫助互聯網用戶從海量文本信息中更容易地找到其最感興趣的內容。研究和運用文本聚類算法對于完成文本數據挖掘任務具有重要的理論價值和現實意義。

目前,已提出了多種文本聚類算法,大體分為如下三類:層次聚類算法、分割聚類算法和概率模型聚類算法。層次聚類算法通常以自頂向下或者自底向上的方式將文本集合組織成一個層次結構;分割聚類算法則按照某種選定標準將文本集合直接分割成幾個聚簇,聚簇的數目通常是預先設定的;而概率模型聚類算法通過概率主題模型來解決文本聚類問題。

其中,分割聚類算法因其具有容易理解、實現簡單的優點而被廣泛研究和使用。分割聚類算法的基本原理和過程是:首先,根據某一選定標準將數據集分割為k份,每份代表一個聚簇。分割產生的聚簇具備兩個特點:1)每個聚簇至少包含一個數據,2)每個數據只屬于一個聚簇。然后,通過反復的迭代過程對初次產生的劃分進行逐步調整。最后,當選定標準達到最優或者迭代收斂條件滿足時算法終止。

從上述算法過程可以看出:分割聚類在算法運行之前需要人工預先指定聚簇個數k,這是其主要問題之一。另外,根據前人研究:分割聚類算法在數據集包含較多類別時算法表現較差。綜上,分割聚類算法存在兩個主要問題:1)在算法運行之前需要人工預先指定聚簇個數;2)在數據集包含較多類別時算法表現較差。

發明內容

針對分割聚類算法在算法運行之前需要人工預先指定聚簇個數以及在數據集包含較多類別時算法表現較差這兩個問題,本發明的目的是提供一種在算法運行之前不需人工預先指定聚類個數(即根據數據集和算法運行情況自適應確定聚類個數)并且在數據集包含較多類別時算法表現較好的分割聚類算法。本發明方法:首先將文本數據集隨機分割成大小相同并且較小的一組聚簇;然后根據文本和各聚簇中心的相似度通過迭代過程對聚簇進行調整、對數據集進行重組;最后當終止條件達到時迭代過程終止,可以獲得更準確的聚類結果。

本發明提供了一種基于中心法并自適應確定聚簇個數的文本聚類算法,所述方法包括如下步驟:

步驟1:初始化算法相關參數

首先,初始化聚簇的“類—特征—中心”(CFC:Class-Feature-Centroid)向量計算參數:b和log函數的底數。其次,設置算法運行控制參數,包括:隨機聚類過程時的初始聚簇大小參數Im,重啟頻率參數Fm和重啟范圍Rm。最后,設置算法終止條件參數:最大迭代次數和收斂準確率。

步驟2:分割數據集

隨機將數據集分割為大小為Im的一組聚簇,并計算每個聚簇的CFC向量。

步驟3:重組數據集

根據每個文本和不同聚簇的CFC向量的相似度重新組織每個文本,以得到新的一組聚簇,重組過程包含兩種處理情況:

(1)非重啟迭代重組:將每個文本分配到和其最相似的CFC向量所屬的聚簇中。

(2)重啟迭代重組:將每個文本分配到和其第2到第Rm相似區間中的某一CFC向量所屬的聚簇中。

步驟4:重新計算各聚簇的CFC向量

在將所有文本重組之后,重新計算每個非空聚簇的CFC向量。

步驟5:判定算法是否終止

算法有兩個終止條件:最大迭代次數和收斂準確率。如果兩個終止條件有一個滿足,則算法終止。否則,算法繼續進行,轉到步驟3。

附圖說明

圖1基于中心法的自適應文本聚類算法流程示意圖。

圖2四個子數據集上本方法與其他4個方法的F值比較圖。

圖3四個子數據集上本方法與其他4個方法的純度比較圖。

圖4四個子數據集上本方法與其他4個方法的信息熵比較圖。

圖5參數Im和F值的關系圖。

圖6參數Fm和F值的關系圖。

圖7參數Rm和F值的關系圖。

圖8重啟和非重啟情況下的F值比較圖。

圖9重啟和非重啟情況下的純度比較圖。

圖10重啟和非重啟情況下的信息熵比較圖。

具體實施方式

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于吉林大學,未經吉林大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201410014995.7/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 99国产精品99久久久久久粉嫩| 欧美日韩综合一区| 免费毛片**| 一区二区三区国产精品| 国产91在线播放| 亚洲精品中文字幕乱码三区91| 国产女人和拘做受视频免费| 午夜av片| 欧美日韩高清一区二区| 精品少妇一区二区三区免费观看焕| 99欧美精品| 欧美在线观看视频一区二区| 久久精品国语| 国产精品麻豆99久久久久久| 久爱精品视频在线播放| 久久99久国产精品黄毛片入口| 欧美精品一区二区久久| 狠狠插狠狠爱| 26uuu亚洲国产精品| 亚洲久色影视| 中文字幕欧美一区二区三区| 91久久精品国产91久久性色tv| 97人人揉人人捏人人添| 国产亚洲精品久久久久久网站| 国产精品一区在线观看你懂的 | 狠狠躁夜夜躁xxxxaaaa| 91麻豆精品国产91久久久久| 国产伦精品一区二区三区免| 欧美一区二区三区久久久久久桃花| 欧美国产在线看 | 97精品超碰一区二区三区| 国产精品香蕉在线的人| 午夜理伦影院| 高清欧美xxxx| 国产精品无码专区在线观看| 国产原创一区二区| 综合久久激情| 日韩中文字幕久久久97都市激情| 狠狠色丁香久久婷婷综| 亚洲国产精品激情综合图片| 91一区在线| 久久99精品国产麻豆婷婷| 精品国产免费一区二区三区| 偷拍久久精品视频| 一区二区在线国产| 日韩中文字幕一区二区在线视频| 日韩国产精品一区二区| 国产三级精品在线观看| 国产精品高清一区| 99精品国产99久久久久久97| 国产精品一区二区麻豆| 国产精品一二三区视频出来一 | 91久久香蕉国产日韩欧美9色| 狠狠插狠狠爱| 欧美一区二区精品久久| 国产一二区视频| 久久99精品国产麻豆宅宅| 国产精品一区二区av麻豆| 精品国产乱码久久久久久久| 在线观看国产91| 亚洲精品久久久久中文字幕欢迎你 | 黑人巨大精品欧美黑寡妇| 68精品国产免费久久久久久婷婷| 久久国产麻豆| 精品欧美一区二区精品久久小说| 精品婷婷伊人一区三区三| 色一情一乱一乱一区免费网站| 亚洲欧美国产中文字幕| 欧美日韩国产91| 午夜激情在线| 久久福利视频网| 久久人人爽爽| 欧美资源一区| 国产天堂第一区| 日本看片一区二区三区高清| 日本美女视频一区二区三区| 一本一道久久a久久精品综合蜜臀| 国产亚洲精品久久久456| 日韩中文字幕区一区有砖一区| 亚洲乱子伦| 国产中文字幕一区二区三区 | 91高跟紫色丝袜呻吟在线观看| 国产精品女人精品久久久天天| 狠狠插狠狠插| 国产91免费在线| 年轻bbwbbw高潮| 欧美二区在线视频| 久久精品国产99| 亚洲欧美色图在线| 久久夜靖品2区| 日韩欧美一区二区久久婷婷| 日韩精品中文字幕一区二区三区| 亚洲精品国产一区二区三区| 一区精品二区国产| 午夜精品999| 一本久久精品一区二区| 一区二区三区毛片| 日韩av免费网站| 国产电影精品一区| 伊人av综合网| 国产精品亚洲第一区| 亚洲国产精品二区| 久久福利免费视频| 国产欧美亚洲精品第一区软件| 亚欧精品在线观看| 欧美综合在线一区| 正在播放国产一区二区| 亚洲精品色婷婷| 日韩欧美一区二区久久婷婷| 久久91久久久久麻豆精品| 日本精品一区在线| 国产精品精品国内自产拍下载| 亚洲精品www久久久久久广东| 亚洲欧洲精品一区二区三区不卡| 久久九精品| 好吊色欧美一区二区三区视频| 日韩精品中文字幕久久臀| 国产88在线观看入口| 狠狠色丁香久久婷婷综| 国产精品国产三级国产专播精品人| 国产精品一区二区不卡| 一区二区三区国产精品| 男人的天堂一区二区| 欧美一区二区三区日本| 国语对白一区二区三区| 国产区一二| 国产精品一二三区视频网站| 欧美精品国产精品| 国产欧美精品一区二区三区小说 | 国产精品一二三四五区| 国产一区在线免费| 精品福利一区| 日韩av一区不卡| 欧美精品免费视频| 国产免费一区二区三区四区| xxxxhd欧美| 国产欧美一区二区精品久久| 国产高清在线精品一区二区三区| 狠狠色丁香久久综合频道日韩| 夜夜精品视频一区二区| 7777久久久国产精品| 少妇高潮在线观看| 色综合久久精品| 精品国产伦一区二区三区| 国产中文字幕91| 精品99免费视频| 97人人模人人爽人人喊0| 亚洲精品少妇一区二区 | 国产精品乱综合在线| 香蕉免费一区二区三区在线观看| 欧美中文字幕一区二区| 91久久精品国产亚洲a∨麻豆 | 久久精视频| 日本午夜一区二区| 欧美精品一区二区性色| 欧美日韩精品不卡一区二区三区| 国产精品乱码一区| 年轻bbwbbw高潮| 狠狠色噜噜狠狠狠四色米奇| 日本一区二区三区在线看| 91久久精品国产亚洲a∨麻豆| 国产激情二区| 亚洲高清国产精品| 一区二区三区毛片| 日本一区二区三区中文字幕| 久久国产精彩视频| 狠狠色噜噜狠狠狠狠综合久| 久久久久国产精品一区二区三区| 国产精品99在线播放| 午夜影院色| 国产69精品久久99不卡解锁版| 午夜精品一区二区三区在线播放| 欧美激情在线观看一区| 一二三区欧美| 曰韩av在线| 91久久国产露脸精品| 精品国产一级| 国产一区欧美一区| 国产精彩视频一区二区| xxxx在线视频| 国产精品1234区| 国产69精品久久久久app下载| 91一区在线| 国产一二三区免费| 99久久国产综合精品麻豆| 午夜肉伦伦影院九七影网| 久久96国产精品久久99软件| 91午夜精品一区二区三区| 国产一区二区电影| 日韩中文字幕久久久97都市激情| 玖玖爱国产精品| 91精品国产一区二区三区| 99色精品视频| 国产二区视频在线播放| 中文字幕a一二三在线| 88国产精品视频一区二区三区 | 国产精品对白刺激在线观看| 99视频国产在线| 国产福利一区在线观看| 国产在线一二区| 亚洲日韩欧美综合| 精品少妇一区二区三区| 欧美日韩亚洲三区| 国产一区二区播放| 午夜影院伦理片| 99国产精品| 免费看性生活片| 色综合久久精品| 福利片一区二区三区| 一区二区91| 国产极品美女高潮无套久久久| 国产精品视频十区| 欧美精品日韩一区| 亚洲精品乱码久久久久久高潮| 中文字幕一区二区三区乱码 | 欧美片一区二区| 日本精品一二区| 免费a一毛片| 日本一二三四区视频| 午夜伦全在线观看| 护士xxxx18一19| 在线播放国产一区| 婷婷午夜影院| 91精品黄色| 精品国产亚洲一区二区三区| 久久人做人爽一区二区三区小说| 欧美色综合天天久久| 午夜av电影院| 97人人添人人爽一区二区三区| 国产在线一卡| 精品91av| 久久精品亚洲精品国产欧美| 欧美日韩久久一区二区| 亚洲欧美国产精品一区二区| 99国精视频一区一区一三| 精品国产二区三区| 国产女人与拘做受免费视频| 精品国产一区二区三区忘忧草| 99精品国产99久久久久久97| 欧美一区二区色| 国产欧美日韩一级| 天干天干天啪啪夜爽爽99| www.久久精品视频| 亚洲一二三四区| 日本精品三区| 性视频一区二区三区|