日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種分布式數據挖掘模型評估的方法與系統在審

專利信息
申請號: 201611179166.X 申請日: 2016-12-19
公開(公告)號: CN106599230A 公開(公告)日: 2017-04-26
發明(設計)人: 婁海鳳;張立軍 申請(專利權)人: 北京天元創新科技有限公司
主分類號: G06F17/30 分類號: G06F17/30
代理公司: 北京路浩知識產權代理有限公司11002 代理人: 湯財寶
地址: 100193 北京市海淀*** 國省代碼: 北京;11
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 分布式 數據 挖掘 模型 評估 方法 系統
【說明書】:

技術領域

發明涉及數據分析挖掘技術領域,更具體地,涉及一種分布式數據挖掘模型評估的方法與系統。

背景技術

目前,隨著大數據時代的到來,海量數據的分類應用問題越來越多,數據挖掘成為一種嶄新的商業信息處理技術;對數據及數據的挖掘處理進行建模的數據挖掘模型越來越重要。其中,對問題進行分類挖掘提取的具有分類算法的數據挖掘模型的預測能力成為更多用戶青睞的對象。

而數據挖掘模型的種類及其所使用的算法非常多,對于某一類具體數據的挖掘,模型也有優劣之分。如何在眾多數據挖掘模型中選擇性能滿足要求的模型非常重要,因為好的數據挖掘模型不僅準確率高而且速度快。

傳統的對數據挖掘模型的選擇,一般是由數據分析人員逐個構建多個模型并對比分模型結果,利用專業知識進行判別而選擇的最佳模型。這種人工的模型評估的方法,需要評估人具有專業的知識儲備,且評估結果的有效性和適用性具備較強的主觀性。

傳統的智能算法評估模型采用常規的并行計算方式,有兩個問題,其一是模型不支持分布式算法,其二是在使用大量數據進行算法評估時,模型速度較慢。

現有數據挖掘產品如R、SPSS Modeler、RapidMiner等,模型計算效率低下,模型評估流程復雜。

基于Spark數據分析架構的針對分類模型的模型評估模塊中,包含部分分類算法的分布式評估指標代碼包,但遠不能滿足其他分類模型的評估。

發明內容

本發明提供一種克服上述問題或者至少部分地解決上述問題的分布式數據挖掘模型評估的方法與系統。

根據本發明的一個方面,提供一種分布式數據挖掘模型評估的方法,包括:

S1,利用特定評估指標集生成模型評估模塊;

S2,基于評估數據集,利用所述模型評估模塊以分布式策略對至少一個數據挖掘模型進行評估。

進一步,所述S1進一步包括:

S1.1,建立評估指標庫,將所述特定評估指標集配置到所述評估指標庫中;

S1.2,生成一個包含所述特定評估指標集中的全部評估指標的模型評估模塊。

進一步,所述S2進一步包括:

S2.1,從大數據中獲取所述評估數據集,選取數據挖掘算法對所述評估數據集進行數據分析,獲得數據挖掘模型;

S2.2,基于Spark分布式計算框架,利用所述模型評估模塊對所述數據挖掘模型進行評估,以評估數據挖掘模型或數據挖掘算法的優劣。

具體的,所述特定評估指標集中的評估指標包括準確率、召回率、F-測量、ROC曲線、AUC面積、均方誤差、均方根誤差和平均絕對誤差。

進一步,所述S2.1進一步包括:

基于一個數據挖掘算法,配置不同的參數對所述評估數據集進行數據分析,獲得用于評估數據挖掘模型的多個數據挖掘模型;或者

基于多個數據挖掘算法,對所述評估數據集進行數據分析,獲得用于評估數據挖掘算法的多個數據挖掘模型。

進一步,所述S2.2進一步包括:

S2.2.1,將所述模型評估模塊配置為評估流程節點;

S2.2.2,基于所述評估流程節點和預設的評估指標,利用所述Spark分布式計算框架對待評估的數據挖掘模型進行評估,獲得評估結果,并將所述評估結果寫入數據庫。

進一步,所述S2.2進一步包括:

S2.2.4,通過增益圖和提升圖對所述評估結果進行顯示。

進一步,所述S2.2進一步包括:

所述模型評估模塊對基于一個數據挖掘算法的多個數據挖掘模型分別進行評估,獲得對所述多個數據挖掘模型的評估結果;或者

所述模型評估模塊對基于多個數據挖掘算法的多個數據挖掘模型分別進行評估,獲得對所述多個數據挖掘算法的評估結果。

具體的,所述預設的評估指標為所述特定評估指標集中的至少一種。

根據本發明的另一個方面,一種分布式數據挖掘模型評估的系統,包括評估模塊生成模塊和模型評估模塊,

所述評估模塊生成模塊,用于利用特定評估指標集生成模型評估模塊;

所述模型評估模塊,用于基于評估數據集,利用所述模型評估模塊以分布式策略對至少一個數據挖掘模型進行評估。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京天元創新科技有限公司,未經北京天元創新科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201611179166.X/2.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖、流程工藝圖技術構造圖;

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 少妇又紧又色又爽又刺激视频网站| 一本色道久久综合亚洲精品图片 | 91人人爽人人爽人人精88v | 91精品久久久久久| 国产精品一二三在线观看| 国产盗摄91精品一区二区三区| 久久国产视屏| 一区精品二区国产| 狠狠色综合久久丁香婷婷| 国产精品久久久久久久久久久不卡| 婷婷嫩草国产精品一区二区三区| 午夜情所理论片| 狠狠色噜噜狠狠狠狠777| 特级免费黄色片| 麻豆精品国产入口| 欧美一区久久| 97视频久久久| 人人玩人人添人人澡97| 国产午夜精品一区二区三区视频| 国产一区二区伦理| 欧美一级免费在线视频| 午夜叫声理论片人人影院| 久久久久国产精品www| 中文字幕一区二区三区四| 久久国产精品99国产精| 国产高清在线一区| 国产又色又爽无遮挡免费动态图| 色妞妞www精品视频| 欧美午夜精品一区二区三区| 国产午夜精品一区二区三区在线观看 | 久久久久亚洲精品| 亚洲**毛茸茸| 狠狠色噜噜狠狠狠狠2021免费| 91avpro| 国产精品亚洲二区| 国产一区二区三区大片| 国产乱人伦精品一区二区三区| 韩国视频一区二区| 国产一区二区伦理片| 亚洲精品国产91| 91精品系列| 国产乱一区二区三区视频| 国产精品入口麻豆九色| 亚洲1区2区3区4区| 欧美日韩一区二区三区在线观看视频| 中文字幕日韩精品在线| 日韩精品久久一区二区三区| 扒丝袜网www午夜一区二区三区| 日韩女女同一区二区三区| 国产精品亚洲一区| 国产真实一区二区三区| 久久久精品观看| 国产一区二区视频免费在线观看 | 午夜精品一区二区三区在线播放| 日韩精品一区二区三区不卡| 国产影院一区二区| 日本亚洲国产精品| 精品国产区一区二| 91一区在线| 国产精品久久久久久久久久嫩草| 国产69精品久久777的优势| 国产品久久久久久噜噜噜狼狼| 国产精品久久久久久久久久久新郎| 国产一区二区午夜| 99久久精品国产系列| 日本午夜影视| 欧美午夜看片在线观看字幕| 欧美日韩精品在线播放| 91国产在线看| 亚洲神马久久| 国产精品刺激对白麻豆99| 国产一区二区午夜| 99久久免费精品国产男女性高好 | 亚洲精品国产suv| 狠狠色狠狠色综合日日五| 欧美激情片一区二区| 国产足控福利视频一区| 精品欧美一区二区在线观看| 国产精品一品二区三区四区五区| 欧美一区二区三区艳史| 欧美精品久久一区| 亚洲制服丝袜在线|