日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]對文檔進行聚類的方法和裝置有效

專利信息
申請號: 201310157114.2 申請日: 2013-04-28
公開(公告)號: CN103455534B 公開(公告)日: 2017-02-08
發明(設計)人: 黃平春 申請(專利權)人: 北界創想(北京)軟件有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京潤澤恒知識產權代理有限公司11319 代理人: 蘇培華
地址: 100020 北京*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 文檔 進行 方法 裝置
【說明書】:

技術領域

發明涉及互聯網領域,特別涉及一種對文檔進行聚類的方法和裝置。

背景技術

在互連網信息急劇增加的環境下,如何有效準確的得到所需的信息成為亟待解決的技術問題。其中,如何對網絡文檔進行聚類以得到多種文檔類別尤為關鍵。

現有技術中對文檔進行聚類的方法智能性較低,需要依靠人工的參與,即預先人工輸入聚類數值,確定將文檔聚為幾類后,才能開始聚類,例如,人工輸入將文檔聚為3類或4類。當人工輸入的聚類數值不準時,聚類效果會受到很大影響,進一步地,當文檔數量為海量時,人工無法給出一個聚類數值,聚類操作難以進行。

發明內容

本發明實施例提供一種對文檔進行聚類的方法和裝置,避免了人工參與,提高了對文檔進行聚類的準確性和智能性。

本發明為了實現上述目的提供一種對文檔進行聚類的方法,包括:步驟A、對文檔分別進行矢量化,其中,每篇文檔在矢量化后對應多維空間中的一個文檔坐標;步驟B、將多個文檔坐標聚為兩個簇并分別獲取每個簇在多維空間中的幾何中心;步驟C、分別計算每個簇的平均半徑,并在平均半徑滿足預設條件時,將兩個簇中的文檔坐標對應的文檔聚為一個不可分裂的類,在平均半徑不滿足預設條件時,將兩個簇分別對應為兩個可分裂的類,其中,平均半徑為簇中所有文檔坐標到幾何中心的距離的平均值;步驟D、在每個可分裂的類中,再次執行步驟B和步驟C;以及步驟E、當每篇文檔都屬于不可分裂的類時,終止聚類。

在一個實施例中,步驟B包括:步驟F、根據文檔坐標的距離將多個文檔坐標聚為兩個簇中。

在一個實施例中,步驟F包括:步驟G、等概率選取兩個文檔坐標;步驟H、分別計算每個未選取的文檔坐標與選取的兩個文檔坐標的距離,并將未選取的文檔坐標與距其距離短的選取的文檔坐標聚為同一個簇。

在另一個實施例中,步驟F包括:步驟G、隨機選取一個文檔坐標;步驟H、將在選取的文檔坐標預設距離內的多個文檔坐標聚為一個簇,將不在選取的文檔坐標預設距離內的多個文檔坐標聚為一個簇。

在一個實施例中,在步驟B與步驟C之間,還包括:步驟I、將每個文檔坐標與兩個幾何中心進行比較,并將其與兩個幾何中心中距其距離短的幾何中心聚為一個新一代的簇;步驟J、獲取每個新一代的簇在多維空間中的幾何中心,當相鄰兩代的簇的幾何中心的距離差值不滿足預設的閾值時,重復步驟I,當相鄰兩代的簇的幾何中心的距離差值滿足預設的閾值時,執行步驟C。

在一個實施例中,預設條件包括:兩個簇的平均半徑之和不小于兩個幾何中心之間的距離。

本發明為了實現上述目的還提供一種對文檔進行聚類的裝置,包括:獲取模塊,用于對所述文檔分別進行矢量化,其中,每篇文檔在矢量化后對應多維空間中的一個文檔坐標;第一分類模塊,用于將多個所述文檔坐標聚為兩個簇并分別獲取每個簇在所述多維空間中的幾何中心;處理模塊,用于分別計算所述每個簇的平均半徑,并在所述平均半徑滿足預設條件時,將所述兩個簇中的所述文檔坐標對應的文檔聚為一個不可分裂的類,在所述平均半徑不滿足預設條件時,將所述兩個簇分別對應為兩個可分裂的類,其中,所述平均半徑為所述簇中所有文檔坐標到所述幾何中心的距離的平均值;第一調用模塊,用于在所述每個可分裂的類中,再次調用所述第一分類模塊和所述處理模塊對所述可分裂的類中的文檔坐標進行操作;以及終止模塊,用于當每篇文檔都屬于不可分裂的類時,終止聚類。

在一個實施例中,第一分類模塊根據文檔坐標的距離將多個文檔坐標聚為兩個簇中。

在一個實施例中,第一分類模塊包括:選取子模塊,用于等概率選取兩個文檔坐標;分類子模塊,用于分別計算每個未選取的文檔坐標與選取的兩個文檔坐標的距離,并將未選取的文檔坐標與距其距離短的選取的文檔坐標聚為同一個簇。

在另一個實施例中,第一分類模塊包括:選取子模塊,用于隨機選取一個文檔坐標;分類子模塊,用于將在選取的文檔坐標預設距離內的多個文檔坐標聚為一個簇,將不在選取的文檔坐標預設距離內的多個文檔坐標聚為一個簇。

在一個實施例中,上述裝置還包括:第二分類模塊,用于將每個文檔坐標與兩個幾何中心進行比較,并將其與兩個幾何中心中距其距離短的幾何中心聚為一個新一代的簇;第二調用模塊,用于獲取每個新一代的簇在多維空間中的幾何中心,當相鄰兩代的簇的幾何中心的距離差值不滿足預設的閾值時,調用第二分類模塊,當相鄰兩代的簇的幾何中心的距離差值滿足預設的閾值時,調用處理模塊。

在一個實施例中,預設條件包括:兩個簇的平均半徑之和不小于兩個幾何中心之間的距離。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北界創想(北京)軟件有限公司,未經北界創想(北京)軟件有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201310157114.2/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 欧美一区二区三区久久久久久桃花 | 国产偷亚洲偷欧美偷精品| 日韩av在线播| 91片在线观看| 国产一区二区极品| 国产大片一区二区三区| 亚洲国产精品麻豆| 国产二区三区视频| 欧美一区二区综合| 欧美一级不卡| 久久久一区二区精品| 91看片淫黄大片91| 日韩av在线导航| 国产精品自拍在线观看| 自偷自拍亚洲| 国产vsv精品一区二区62| 麻豆精品久久久| 久久久久国产精品一区二区三区| 亚洲精品久久久久不卡激情文学| 国产精品麻豆一区二区| 国产精一区二区三区| 午夜伦理片在线观看| 精品一区二区三区视频?| 国产一区观看| 国产精品久久久爽爽爽麻豆色哟哟| 国产午夜三级一二三区| 午夜激情影院| 午夜特片网| 少妇自拍一区| 日韩av在线影院| 高清国产一区二区| 制服丝袜二区| 日韩av不卡一区| 在线国产91| 国产欧美综合一区| 日本白嫩的18sex少妇hd| 国产麻豆91欧美一区二区| 国产一区二区综合| 国产亚洲精品久久久久动| 亚洲欧美另类国产| 一区二区三区国产精品视频| 欧美一区二区三区精品免费| 国产精品视频久久久久久| 国产精品日韩电影| 国产91热爆ts人妖在线| **毛片免费| 国产一区二区二| 日韩精品999| 欧美午夜精品一区二区三区| 欧美一区二区在线不卡| 99精品区| 国产精品9区| 精品国产一区二区三区久久久久久| 午夜影院h| 99久久免费毛片基地| 欧美日韩中文字幕一区| 中文字幕在线一二三区| 人人要人人澡人人爽人人dvd| 99国产精品99久久久久| 国产精品一区二区中文字幕| 国产乱人乱精一区二视频国产精品| 色偷偷一区二区三区| 欧美黄色片一区二区| 欧美色图视频一区| 国产精品视频一区二区在线观看| 久久久久久久久亚洲精品一牛| 国产不卡一二三区| 97久久精品人人做人人爽50路| 一区二区三区国产欧美| 精品婷婷伊人一区三区三| 三上悠亚亚洲精品一区二区| 欧美日韩国产精品一区二区| 艳妇荡乳欲伦2| 久久免费精品国产| 亚洲精品久久久久www| 亚洲乱强伦| 国产999在线观看| 国内久久精品视频| 强制中出し~大桥未久10在线播放| 欧美日本91精品久久久久| 国产精品九九九九九| 久久99精品国产麻豆婷婷| 丰满少妇高潮惨叫久久久| 午夜av电影网| 青苹果av| 国产91免费在线| 精品久久二区| 九九视频69精品视频秋欲浓| 91精品啪在线观看国产| 欧美性受xxxx狂喷水| 26uuu亚洲国产精品| 国产精品一区二区久久乐夜夜嗨 | 久久精品国产99| 99久久夜色精品国产网站| 欧美3级在线| 猛男大粗猛爽h男人味| 国产精品综合在线| 欧美一区二区三区日本| 久久影院一区二区| 国产精品色在线网站 | 日本一区二区三区电影免费观看| 国产精品一区二区毛茸茸| 综合久久一区| 国产精品久久久区三区天天噜| 大bbw大bbw巨大bbb| 国产一区二区大片| 日韩欧美精品一区二区三区经典| 日本高清不卡二区| 狠狠躁夜夜| 一级午夜影院| 欧美一级特黄乱妇高清视频| 韩日av一区二区三区| 亚洲区日韩| 国产精品5区| 99久久精品国产国产毛片小说| 国产一区二区电影在线观看| 亚洲欧美自拍一区| 欧美激情视频一区二区三区| 亚洲va国产| 国产91丝袜在线熟| 亚洲欧洲日韩av| 97人人模人人爽视频一区二区 | 日韩精品一区二区三区在线| 国产欧美一区二区精品久久久| 久久夜色精品久久噜噜亚| 欧美一区二区三区久久久久久桃花| 国产精品免费一视频区二区三区 | 国产欧美日韩一区二区三区四区| 最新国产一区二区| 国产性生交xxxxx免费| 国产资源一区二区| 欧美精品日韩精品| 国产一区二区中文字幕| 欧美久久久一区二区三区| 国产免费第一区| 人人玩人人添人人澡97| 国内精品久久久久影院日本| 亚洲精品性| 黄毛片在线观看| 精品国产鲁一鲁一区二区作者| 久久激情综合网| xxxxhdvideosex| 午夜亚洲国产理论片一二三四| 午夜电影一区| 激情久久综合网| 岛国黄色av| 国产精品日韩一区二区三区| 国产精品一区二区免费| 欧美精品xxxxx| 亚洲精品一区中文字幕| 欧美色综合天天久久| 午夜爽爽爽男女免费观看| 国产日韩欧美三级| 日本美女视频一区二区| 视频一区二区三区中文字幕| 国产精品v一区二区三区| 欧美亚洲精品一区二区三区| 狠狠色狠狠色综合系列| 久久国产精品欧美| 国产日韩精品一区二区| 国产日韩欧美一区二区在线观看 | 国产精品麻豆一区二区三区| 日韩欧美国产第一页| 免费精品一区二区三区视频日产| 国产欧美精品一区二区在线播放| 午夜精品999| 久久激情网站| 麻豆天堂网| 欧美日韩亚洲另类| 91热精品| 欧美日韩一区不卡| 久久久精品中文| 99久久免费精品国产免费高清| 激情久久一区| 国产91九色视频| 羞羞视频网站免费| 午夜伦理在线观看| 国产日韩欧美三级| 亚洲福利视频一区二区| 国产不卡网站| 中文字幕国内精品| 国产高清在线精品一区二区三区| 精品亚洲午夜久久久久91| 欧美777精品久久久久网| 亚洲精品乱码久久久久久写真| 国产精品久久国产三级国电话系列| 日韩久久电影| 日韩免费一级视频| 国产91在| 国产全肉乱妇杂乱视频在线观看| 日韩一级视频在线| 亚洲国产精品肉丝袜久久| 香蕉av一区二区三区| 久免费看少妇高潮a级特黄按摩 | 亚洲国产欧美一区| 欧美日韩激情在线| 日本五十熟hd丰满| 欧洲精品一区二区三区久久| 91视频一区二区三区| 国产精品一区久久人人爽| 国产一区二区三区黄| 欧美精品在线观看视频| 国产精品天堂网| 欧美性猛交xxxxxⅹxx88| 538国产精品一区二区免费视频| 国产精品久久久久久久四虎电影| 国产69精品久久久久999天美| 精品久久久久一区二区| 午夜一二区| 国产精品日韩视频| 日日狠狠久久8888偷色| 精品国产九九| 欧美一区二三区| 欧美日韩一二三四区| 欧美日本91精品久久久久| 99久久国产综合| 国产伦理精品一区二区三区观看体验 | 免费a级毛片18以上观看精品| 久久精品亚洲精品| 久久99精品久久久大学生| 欧美一级不卡| 国产电影一区二区三区下载| 欧美精品综合视频| 国产麻豆一区二区三区在线观看| 国语精品一区| 久久国产精品欧美| 国产免费一区二区三区网站免费 | 6080日韩午夜伦伦午夜伦| 国产精品国精产品一二三区| 国产乱码精品一区二区三区介绍| 国产精品国精产品一二三区| 51区亚洲精品一区二区三区| 国产日韩精品一区二区| 国产一区日韩在线| 午夜电影天堂| 国产一区欧美一区| 国产经典一区二区| 97欧美精品| 国产精品亚洲一区二区三区 | 国产一级二级在线| 91精品国产91热久久久做人人| 日韩久久精品一区二区三区| 日本福利一区二区| 国产97免费视频| 国产午夜精品免费一区二区三区视频| 欧美亚洲精品suv一区|