日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于MapReduce的并行聚類方法有效

專利信息
申請(qǐng)?zhí)枺?/td> 201210434240.3 申請(qǐng)日: 2012-11-05
公開(公告)號(hào): CN103793438B 公開(公告)日: 2017-07-14
發(fā)明(設(shè)計(jì))人: 孫占全 申請(qǐng)(專利權(quán))人: 山東省計(jì)算中心(國(guó)家超級(jí)計(jì)算濟(jì)南中心)
主分類號(hào): G06F17/30 分類號(hào): G06F17/30
代理公司: 暫無(wú)信息 代理人: 暫無(wú)信息
地址: 250014*** 國(guó)省代碼: 山東;37
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 mapreduce 并行 方法
【說(shuō)明書】:

技術(shù)領(lǐng)域

本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,特別涉及大規(guī)模數(shù)據(jù)聚類分析。

背景技術(shù)

隨著電子信息技術(shù)的飛速發(fā)展,電子數(shù)據(jù)量以指數(shù)級(jí)增長(zhǎng),數(shù)據(jù)洪流在很多領(lǐng)域開始出現(xiàn),如生物信息、生物醫(yī)學(xué)、化學(xué)信息、網(wǎng)頁(yè)等等。如何充分利用海量數(shù)據(jù)挖掘有用信息,從而輔助企業(yè)決策是信息領(lǐng)域?qū)<宜媾R的巨大挑戰(zhàn)。如果能夠充分挖掘電子信息,將為企業(yè)帶來(lái)巨大效益,如果不能從海量數(shù)據(jù)中挖掘有用信息,將成為電子垃圾,成為企業(yè)負(fù)擔(dān)。數(shù)據(jù)挖掘是從大量數(shù)據(jù)集中發(fā)現(xiàn)新模式的過(guò)程,結(jié)合了人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)和數(shù)據(jù)庫(kù),是目前分析數(shù)據(jù)的最有效手段。國(guó)內(nèi)外很多學(xué)者從事這方面的研究,很多數(shù)據(jù)挖掘方法已被應(yīng)用到實(shí)際當(dāng)中。隨著數(shù)據(jù)規(guī)模的擴(kuò)大,很多傳統(tǒng)的數(shù)據(jù)挖掘方法已不實(shí)用,針對(duì)大規(guī)模數(shù)據(jù)密集型的并行數(shù)據(jù)挖掘方法研究是近年來(lái)信息領(lǐng)域的研究重點(diǎn)。有效的并行算法和實(shí)現(xiàn)技術(shù)是實(shí)現(xiàn)大規(guī)模數(shù)據(jù)挖掘的關(guān)鍵。很多并行挖掘算法以不同技術(shù)實(shí)現(xiàn),如多線程、MPI技術(shù)、MapReduce技術(shù)、工作流技術(shù)等,不同的實(shí)現(xiàn)技術(shù)有不同的性能和使用特性,MPI模式適用于計(jì)算密集型問(wèn)題,特別適用于仿真,但編程復(fù)雜度較高,對(duì)運(yùn)行環(huán)境的時(shí)延要求高,容錯(cuò)性較差。MapReduce是信息檢索領(lǐng)域提出的一種適于數(shù)據(jù)分析的云技術(shù),適合于數(shù)據(jù)密集型的并行數(shù)據(jù)挖掘。目前有幾種MapReduce的結(jié)構(gòu),傳統(tǒng)的MapReduce架構(gòu)只是單向的Map和Reduce過(guò)程,不支持迭代,不適合復(fù)雜的數(shù)據(jù)挖掘算法。最新由美國(guó)印第安那大學(xué)教授提出的Twister軟件,是一種迭代MapReduce模型,支持算法的迭代,大大提供了MapReduce算法的實(shí)用性。

數(shù)據(jù)聚類是是對(duì)于靜態(tài)數(shù)據(jù)分析的一門技術(shù),在許多領(lǐng)域受到廣泛應(yīng)用,包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別、圖像分析以及生物信息等。聚類的目的是把相似的對(duì)象通過(guò)靜態(tài)分類的方法分成不同的組別或者更多的子集,這樣讓在同一個(gè)子集中的成員對(duì)象都有相似的一些屬性,是一種無(wú)監(jiān)督方法。很多聚類方法已被研究,如k均值聚類、Fisher聚類、Kohonen聚類、基于信息瓶頸理論聚類方法等,不同聚類方法具有不同的聚類性質(zhì),適用于不同的聚類問(wèn)題。K均值聚類應(yīng)用最廣,但聚類的距離測(cè)度只能度量變量之間的線性相關(guān)性。Kohonen聚類是一種自適應(yīng)神經(jīng)網(wǎng)絡(luò),但聚類測(cè)度通常也是歐幾里德距離,無(wú)法度量變量之間的任意相關(guān)性。基于信息瓶頸理論的聚類是基于信息熵理論的聚類方法,以信息損失量為測(cè)度度量變量之間的相關(guān)性,可以統(tǒng)計(jì)變量之間任意統(tǒng)計(jì)相關(guān)性,已被用于多個(gè)領(lǐng)域的聚類問(wèn)題,取得理想的效果。但隨著數(shù)據(jù)規(guī)模的擴(kuò)大,基于信息瓶頸理論聚類方法的計(jì)算量越來(lái)越大,已不適于大規(guī)模的數(shù)據(jù)分析問(wèn)題。基于信息瓶頸理論聚類方法的優(yōu)點(diǎn),本專利提出了基于MapReduce編程模式的并行聚類方法,有效解決了大規(guī)模聚類分析問(wèn)題。

基于MapReduce的并行聚類方法可用于生物信息的DNA數(shù)據(jù)聚類,生物信息數(shù)據(jù)量非常龐大,每天都會(huì)產(chǎn)生大量的DNA數(shù)據(jù),DNA序列聚類是生物信息的重要內(nèi)容之一,如何對(duì)大規(guī)模的DNA序列進(jìn)有效聚類是研究熱點(diǎn)。DNA數(shù)據(jù)通常用A、C、G、T字符串組成,為實(shí)現(xiàn)DNA數(shù)據(jù)進(jìn)行序列對(duì)比,通常需要對(duì)DNA字符對(duì)進(jìn)行統(tǒng)計(jì),將DNA序列轉(zhuǎn)化成概率向量,通過(guò)計(jì)算兩個(gè)概率向量的距離來(lái)度量DNA序列直接的相關(guān)性,從而利用本發(fā)明專利實(shí)現(xiàn)DNA序列的有效聚類。

基于MapReduce聚類方法與其它聚類方法相比主要有以下優(yōu)點(diǎn):

1)用信息損失量作為度量?jī)蓚€(gè)變量之間的距離測(cè)度,可以度量變量之間任意統(tǒng)計(jì)相關(guān)性;

2)本發(fā)明可用客觀的方法確定聚類數(shù),有效避免現(xiàn)有聚類方法人為主觀指定聚類數(shù)的缺點(diǎn);

3)本發(fā)明專利提出的基于MapReduce并行聚類方法適于大規(guī)模數(shù)據(jù)聚類,有效提高聚類效率和性能。

發(fā)明內(nèi)容

本發(fā)明的目的之一在于提出一種基于MapReduce的并行聚類方法,該方法以信息損失作為樣本之間距離的測(cè)度,以MapReduce編程模式實(shí)現(xiàn)聚類中心的并行計(jì)算,為聚類數(shù)確定提供了客觀標(biāo)準(zhǔn),避免主觀指定聚類數(shù)的弊端。

為達(dá)到上述目的,本發(fā)明采用的技術(shù)方案為:

該基于MapReduce的并行聚類方法,包括步驟:

將原數(shù)據(jù)集進(jìn)行轉(zhuǎn)換,以概率的形式進(jìn)行描述;

對(duì)原數(shù)據(jù)進(jìn)行劃分,設(shè)定聚類參數(shù);

以基于MapReduce的并行信息瓶頸理論聚類方法確定聚類數(shù)和初始聚類中心;

以基于MapReduce的并行中心聚類方法實(shí)現(xiàn)最終聚類結(jié)果。

附圖說(shuō)明

圖1基于迭代MapReduce編程模式的Twister軟件架構(gòu)

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于山東省計(jì)算中心(國(guó)家超級(jí)計(jì)算濟(jì)南中心),未經(jīng)山東省計(jì)算中心(國(guó)家超級(jí)計(jì)算濟(jì)南中心)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201210434240.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产视频在线一区二区| 国产精品偷伦一区二区| 亚洲国产精品女主播| 日韩av免费网站| 欧美一区二区三区久久精品| 日本中文字幕一区| 福利片午夜| 中文字幕在线播放一区| 人人澡超碰碰97碰碰碰| 国产欧美三区| 国产亚洲欧美日韩电影网| 欧美日韩一区二区三区69堂| 国产欧美日韩精品一区二区三区 | 99国产精品99久久久久久粉嫩| 国产精品高潮在线| 91精品久久久久久久久久| 国产精品久久久麻豆| 国产精品一区不卡| 91精品一区二区在线观看| 午夜精品99| 欧美系列一区二区| 老女人伦理hd| 夜夜躁狠狠躁日日躁2024| 69久久夜色精品国产69–| 26uuu亚洲国产精品| 911久久香蕉国产线看观看| 91理论片午午伦夜理片久久| 国产二区三区视频| 午夜影院色| 波多野结衣女教师电影| 少妇高清精品毛片在线视频| 51区亚洲精品一区二区三区| 国产精品第157页| 91秒拍国产福利一区| 久久久久国产亚洲| 精品久久久影院| 国产视频一区二区不卡| 性欧美一区二区三区| 欧美午夜羞羞羞免费视频app| 亚洲第一天堂无码专区| 亚洲精品国产精品国产| 一级久久久| 性国产日韩欧美一区二区在线| 销魂美女一区二区| 国产99久久久国产精品免费看| 日韩一级在线视频| 亚洲二区在线播放视频| 久久精品国产综合| 亚洲精品日本无v一区| 久久91精品国产91久久久| 99久久99精品| 亚洲欧美一二三| freexxxxxxx| 狠狠躁夜夜躁xxxxaaaa| 国产精品中文字幕一区二区三区 | 国产99久久九九精品| 国产品久精国精产拍| 欧美乱妇在线视频播放| 视频国产一区二区| 亚洲国产aⅴ精品一区二区16| 亚洲欧美制服丝腿| 国产日韩欧美三级| 午夜毛片影院| 99热久久这里只精品国产www| 狠狠色狠狠色合久久伊人| 国产精品中文字幕一区二区三区| 亚洲va国产2019| 国产精品久久久久久久久久久不卡| 欧美67sexhd| 大bbw大bbw巨大bbw看看| 欧美一区二区三区爽大粗免费| 欧美午夜精品一区二区三区| 精品美女一区二区三区| 一区二区三区免费高清视频| 欧美一区二区三区不卡视频| 日韩欧美中文字幕一区| 亚洲区在线| 国产乱对白刺激在线视频| 色一情一乱一乱一区99av白浆| 国产精品99在线播放| 国产91九色在线播放| 欧美在线播放一区| 国产欧美视频一区二区三区| 精品国产91久久久| 精品999久久久| 狠狠躁夜夜躁人人爽天天天天97 | 香蕉av一区| 国产一区日韩一区| 国产理论一区| 中文字幕欧美一区二区三区| 99久热精品| 久久九九亚洲| 手机看片国产一区| 国产日韩欧美一区二区在线播放| 欧美高清视频一区二区三区| 97精品国产97久久久久久免费| 国产精一区二区三区| 亚洲美女在线一区| 88国产精品欧美一区二区三区三| 精品久久久久久亚洲综合网| 亚洲午夜精品一区二区三区| 欧美日韩激情一区二区| 精品婷婷伊人一区三区三| 国产精品九九九九九| www.午夜av| 999久久久国产精品| 99精品国产免费久久| 国产午夜三级一区二区三| 欧美亚洲精品一区二区三区| 亚洲精品久久久久久久久久久久久久 | 国产女人好紧好爽| 国产精品一二三区免费| 制服.丝袜.亚洲.另类.中文| 亚洲国产一区二区精品| 国产日韩欧美网站| 久精品国产| 欧美一区二区三区精品免费| 欧美日韩一区电影| 国内精品99| 欧美亚洲视频二区| 国产一区二区精华| 91精品一区| 99精品欧美一区二区| 性国产日韩欧美一区二区在线| 99久久夜色精品国产网站| 国产精品久久久久久久龚玥菲| 亚洲欧美日韩视频一区| 久久九九亚洲| 99精品欧美一区二区| 久久精品综合| 国产精品免费专区| 99久久免费毛片基地| 日韩精品久久久久久久的张开腿让| 久久久久久综合网| 国产999精品视频| 亚洲国产99| 国产午夜精品一区二区理论影院 | 激情aⅴ欧美一区二区三区| 国产精品区一区二区三| 欧美一区二区三区中文字幕| 国产黄色一区二区三区| 欧美日韩中文字幕一区二区三区| 久久精品麻豆| 一区二区久久精品| 色综合欧美亚洲国产| 国产精品一卡二卡在线观看| 制服丝袜视频一区| 国产精品一区二区久久乐夜夜嗨| 中文字幕日韩有码| 91性高湖久久久久久久久_久久99| 国产精品欧美一区二区三区奶水| 国产91久| 午夜av电影网| 欧美日韩亚洲三区| 91久久一区二区| 亚洲欧美一二三| 久久密av| 欧美乱妇在线视频播放| 国产伦精品一区二区三区免费优势| 欧美乱偷一区二区三区在线 | 欧美国产一区二区在线| 亚洲美女在线一区| 一级女性全黄久久生活片免费 | 欧美一区二区久久久| 国产在线精品一区二区在线播放| 亚洲欧美国产精品一区二区| 国产91精品高清一区二区三区| 欧美大片一区二区三区| 午夜免费片| 久久久精品观看| 日韩一级视频在线| 午夜亚洲国产理论片一二三四| 大bbw大bbw巨大bbw看看| 久久久久久国产精品免费| 日本一二三区电影| 欧美一区二区色| 日韩av在线播放网址| 久久第一区| 久久夜色精品国产噜噜麻豆| 91精品久久久久久久久久| 国产91精品一区二区麻豆亚洲| 国产一区二区精品免费| 91精品国产影片一区二区三区| 欧美激情图片一区二区| 99国产精品丝袜久久久久久| 中文字幕a一二三在线| 亚洲午夜久久久久久久久电影院| 欧美一区二区久久久| 国产品久久久久久噜噜噜狼狼 | 国产精品日韩高清伦字幕搜索| 国产在线播放一区二区| 强制中出し~大桥未久10| 亚洲欧美视频一区二区| 日韩av中文字幕一区二区| 国产伦理久久精品久久久久| 国产精品美女久久久免费| 国内偷拍一区| 538国产精品一区二区免费视频| 日韩欧美精品一区二区三区经典| 久久99视频免费| 69久久夜色精品国产69–| 日韩精品一区二区三区在线| 91精品国产综合久久国产大片 | 国产高清一区在线观看| 中文乱码字幕永久永久电影| 国产精品99一区二区三区| 国产精品亚发布| 精品99在线视频| 国产精品高潮呻吟三区四区| 91精品婷婷国产综合久久竹菊| 四虎国产精品久久| 艳妇荡乳欲伦2| 精品欧美一区二区在线观看| 国产美女三级无套内谢| 亚洲久色影视| **毛片免费| 狠狠色丁香久久婷婷综合_中| 538国产精品一区二区| 国产精品综合久久| 国产极品一区二区三区| 日韩亚洲精品视频| 色婷婷综合久久久久中文| 91看黄网站| 自偷自拍亚洲| 26uuu亚洲国产精品| 国产精品19乱码一区二区三区| 亚洲精品国产一区二| 久久久久亚洲精品视频| 国产一区二区极品| 欧美日韩中文字幕一区| 欧美精品亚洲一区| 国产精品久久久久久久久久嫩草| 国模一区二区三区白浆| 亚洲欧美日韩精品在线观看| 精品国产二区三区| 欧美日韩精品在线一区二区| 久久久久久久亚洲视频| 国产日本欧美一区二区三区| 91一区在线观看| 国产69精品久久久久app下载| 精品国产乱码久久久久久老虎| 国产一区二区电影| 99国产午夜精品一区二区天美 | 国产精欧美一区二区三区久久久| 国产免费区| 久久99精品国产麻豆婷婷洗澡|