日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發(fā)明專利]一種基于聚類下采樣的不平衡數(shù)據(jù)分類方法在審

專利信息
申請(qǐng)?zhí)枺?/td> 201710784810.4 申請(qǐng)日: 2017-09-04
公開(kāi)(公告)號(hào): CN107688831A 公開(kāi)(公告)日: 2018-02-13
發(fā)明(設(shè)計(jì))人: 曹路 申請(qǐng)(專利權(quán))人: 五邑大學(xué)
主分類號(hào): G06K9/62 分類號(hào): G06K9/62
代理公司: 北京科億知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)11350 代理人: 湯東鳳
地址: 529020 廣*** 國(guó)省代碼: 廣東;44
權(quán)利要求書: 查看更多 說(shuō)明書: 查看更多
摘要:
搜索關(guān)鍵詞: 一種 基于 聚類下 采樣 不平衡 數(shù)據(jù) 分類 方法
【說(shuō)明書】:

技術(shù)領(lǐng)域

發(fā)明涉及模式識(shí)別的研究領(lǐng)域,特別涉及一種基于聚類下采樣的不平衡數(shù)據(jù)的分類方法。

背景技術(shù)

分類問(wèn)題是模式識(shí)別、機(jī)器學(xué)習(xí)等領(lǐng)域內(nèi)非常重要的一個(gè)研究?jī)?nèi)容,在現(xiàn)實(shí)生活中有非常廣泛的應(yīng)用,如銀行系統(tǒng)中的手寫數(shù)字識(shí)別、安保監(jiān)控系統(tǒng)中的人臉識(shí)別和網(wǎng)絡(luò)安全中的入侵檢測(cè)等。目前,處理分類問(wèn)題已經(jīng)有了一些相對(duì)成熟的分類方法,如:決策樹(shù)、K-近鄰、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法,其中,支持向量機(jī)以其完備的理論闡述和良好的實(shí)驗(yàn)結(jié)果受到廣泛關(guān)注。這些傳統(tǒng)的分類方法均是基于類分布平衡假設(shè)而提出的,其主要目的是提高整體的分類性能,對(duì)分布均勻的數(shù)據(jù)集顯示出很好的效果。但是,在現(xiàn)實(shí)生活中所獲取的數(shù)據(jù)往往會(huì)出現(xiàn)類別間樣本數(shù)量不平衡和噪聲干擾等特點(diǎn),使傳統(tǒng)的分類器無(wú)法達(dá)到預(yù)期效果。

不平衡數(shù)據(jù)集在現(xiàn)實(shí)生活中廣泛存在,如生產(chǎn)線上的殘次品檢測(cè)、信用卡欺詐檢測(cè)和疾病診斷等,在這些數(shù)據(jù)集中,樣本數(shù)較多的類別稱為多類,樣本數(shù)較少的類別稱為少類,多類的樣本數(shù)遠(yuǎn)遠(yuǎn)大于少類的樣本數(shù)。在不平衡數(shù)據(jù)集的分類問(wèn)題中,少類樣本的識(shí)別往往是分類的重點(diǎn),如生產(chǎn)線上的產(chǎn)品,大多數(shù)都屬于合格產(chǎn)品,僅有一小部分是殘次品,如果使用傳統(tǒng)的分類方法,殘次品的識(shí)別率很低,就無(wú)法真正實(shí)現(xiàn)檢測(cè)殘次品的目的。因此,如何改善分類器在不平衡分類問(wèn)題上的性能,在不危害多類分類精度的情況下提高少類樣本的識(shí)別率是亟待解決的問(wèn)題。

不平衡數(shù)據(jù)集的分類問(wèn)題研究可分為兩個(gè)方面,一個(gè)是從算法本身入手,通過(guò)改進(jìn)已有的算法,使分類偏向少類,典型的如代價(jià)敏感支持向量機(jī),通過(guò)給少類樣本較高的權(quán)重以提高少類的分類精度。二是在數(shù)據(jù)層面通過(guò)采樣技術(shù)對(duì)不平衡數(shù)據(jù)集進(jìn)行預(yù)處理,使訓(xùn)練集中少類和多類的樣本數(shù)基本平衡。

采樣技術(shù)可分為上采樣和下采樣兩種,上采樣技術(shù)通過(guò)簡(jiǎn)單復(fù)制或采用啟發(fā)式的方法以增加少類樣本的數(shù)量,典型的有隨機(jī)上采樣和SMOTE(Synthetic Minority Over-sampling Technique)算法。SMOTE算法通過(guò)在給定少類樣本點(diǎn)和其K個(gè)近鄰之間隨機(jī)插值構(gòu)造新的樣本點(diǎn),在一定程度上改善不平衡數(shù)據(jù)分類的性能。但無(wú)論是隨機(jī)上采樣還是SMOTE算法,均沒(méi)有遵循數(shù)據(jù)本身的分布規(guī)律,當(dāng)生成的樣本與原始數(shù)據(jù)的分布不一致時(shí),將不可避免引入噪聲,不僅容易過(guò)擬合還增加了算法復(fù)雜度,不能適應(yīng)目前大數(shù)據(jù)的發(fā)展趨勢(shì)。

下采樣通過(guò)刪除某些多類樣本點(diǎn)以減少多類樣本的數(shù)目,典型的有隨機(jī)下采樣和OSS(One Side Selection)算法。OSS算法將多類樣本分為噪聲樣本,邊界樣本,冗余樣本和安全樣本,根據(jù)Tomek Links技術(shù)去掉噪聲點(diǎn)和邊界點(diǎn)以減少少類樣本數(shù)目。因?yàn)闇p少了樣本點(diǎn),下采樣技術(shù)可以降低算法的復(fù)雜度,減少訓(xùn)練時(shí)間。但是,下采樣技術(shù)在將多類樣本刪除的同時(shí)有可能會(huì)丟失具有代表性的多類樣本信息,而使分類面發(fā)生偏移。

發(fā)明內(nèi)容

本發(fā)明的主要目的是克服現(xiàn)有技術(shù)的缺點(diǎn)與不足,提供一種基于聚類下采樣的不平衡數(shù)據(jù)分類方法,在保證多類分類精度的情況下提高少類樣本的識(shí)別率,以提高不平衡數(shù)據(jù)集的分類性能。

本發(fā)明的原理是:支持向量機(jī)是非常依賴支持向量的分類器,本發(fā)明根據(jù)支持向量機(jī)這一重要特性,提出了一種基于聚類下采樣的不平衡數(shù)據(jù)分類方法。首先通過(guò)快速搜索和發(fā)現(xiàn)密度峰值聚類算法將多類分成不同的簇;然后將多類的每一簇與少類樣本點(diǎn)構(gòu)建訓(xùn)練集,通過(guò)支持向量機(jī)訓(xùn)練獲得每一簇的支持向量,保留所有簇的所有支持向量,刪除非支持向量構(gòu)建新的多類樣本點(diǎn)以獲得相對(duì)平衡的數(shù)據(jù)集;最后將獲得的新的數(shù)據(jù)集用支持向量機(jī)進(jìn)行分類。

本發(fā)明采用以下技術(shù)方案:

一種基于聚類下采樣的不平衡數(shù)據(jù)分類方法,包括下述步驟:

(1)將不平衡數(shù)據(jù)集分為訓(xùn)練集和交叉驗(yàn)證集兩部分;

(2)從訓(xùn)練集中提取出多類樣本和少類樣本;

(3)對(duì)訓(xùn)練集的多類樣本利用快速搜索和發(fā)現(xiàn)密度峰值聚類算法進(jìn)行聚類,獲得聚類結(jié)果,將訓(xùn)練集中的多類樣本分為N簇;

(4)將訓(xùn)練集中多類樣本的每一簇樣本與訓(xùn)練集中的少類樣本構(gòu)成新的樣本集,并用支持向量機(jī)分類,獲得訓(xùn)練集中多類樣本的支持向量;

(5)抽取每一簇的支持向量和訓(xùn)練集中的少類樣本一起構(gòu)成新的訓(xùn)練集;

(6)將新的訓(xùn)練集通過(guò)支持向量機(jī)進(jìn)行訓(xùn)練,并通過(guò)交叉驗(yàn)證集進(jìn)行性能評(píng)估。

進(jìn)一步地,步驟(1)中,訓(xùn)練集合交叉集的比例可以根據(jù)需要進(jìn)行分配,一般可以取十折交叉驗(yàn)證,即將數(shù)據(jù)集分成十分,將其中9份作為訓(xùn)練集,1份作為測(cè)試集。

下載完整專利技術(shù)內(nèi)容需要扣除積分,VIP會(huì)員可以免費(fèi)下載。

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于五邑大學(xué),未經(jīng)五邑大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201710784810.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。

×

專利文獻(xiàn)下載

說(shuō)明:

1、專利原文基于中國(guó)國(guó)家知識(shí)產(chǎn)權(quán)局專利說(shuō)明書;

2、支持發(fā)明專利 、實(shí)用新型專利、外觀設(shè)計(jì)專利(升級(jí)中);

3、專利數(shù)據(jù)每周兩次同步更新,支持Adobe PDF格式;

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖流程工藝圖技術(shù)構(gòu)造圖

5、已全新升級(jí)為極速版,下載速度顯著提升!歡迎使用!

請(qǐng)您登陸后,進(jìn)行下載,點(diǎn)擊【登陸】 【注冊(cè)】

關(guān)于我們 尋求報(bào)道 投稿須知 廣告合作 版權(quán)聲明 網(wǎng)站地圖 友情鏈接 企業(yè)標(biāo)識(shí) 聯(lián)系我們

鉆瓜專利網(wǎng)在線咨詢

周一至周五 9:00-18:00

咨詢?cè)诰€客服咨詢?cè)诰€客服
tel code back_top
主站蜘蛛池模板: 国产精品久久免费视频| 国产一区二区三区在线电影| 欧美乱码精品一区二区| 精品久久国产视频| 欧美极品少妇xx高潮| 精品国产91久久久久久久| 国产欧美亚洲一区二区| 亚洲欧美日韩精品在线观看| 国产精品高潮呻吟久| 国产大片黄在线观看私人影院| 亚洲欧美色图在线| 国产日韩欧美第一页| 久久久久久久国产| 欧美视频1区| 国产淫片免费看| 欧美freesex极品少妇| 妖精视频一区二区三区| 午夜av电影院| 日韩美一区二区三区| 久久97国产| 日韩精品一区在线观看| 国产欧美一区二区三区不卡高清| 在线国产精品一区| 国模精品免费看久久久| 国产一区免费在线观看| 综合国产一区| 97久久精品人人做人人爽| 中文文精品字幕一区二区| 久久一区二| 午夜欧美a级理论片915影院| 亚洲欧洲一二三区| 91久久免费| 97国产精品久久| 肥大bbwbbwbbw高潮| 夜夜精品视频一区二区| 91精品综合在线观看| 91久久国产露脸精品国产| 8x8x国产一区二区三区精品推荐| 日韩欧美一区二区在线视频| 精品福利一区二区| 中文字幕理伦片免费看| 亚洲一区二区福利视频| 素人av在线| 精品一区欧美| 久久国产精品-国产精品| 97久久国产亚洲精品超碰热| 精品国产91久久久| 久久国产精品久久久久久电车| 偷拍自中文字av在线| 午夜激情在线| 99精品小视频| 中文丰满岳乱妇在线观看| 国产欧美精品久久| 国产精品奇米一区二区三区小说| 狠狠色狠狠色综合婷婷tag| 亚洲精品456| 天堂av一区二区| 国产在线一区不卡| 亚洲一级中文字幕| 国产理论一区二区三区| 午夜一二区| 欧美一区二区三区艳史| 日本一区中文字幕| 99国产精品一区二区| 99国产精品欧美久久久久的广告| 91人人爽人人爽人人精88v| 国产日韩欧美一区二区在线观看| 99久久久国产精品免费无卡顿| av毛片精品| 国产88在线观看入口| 久久综合伊人77777麻豆最新章节| 国产高潮国产高潮久久久91| 97精品国产97久久久久久粉红 | 日韩精品一区二区久久| 午夜666| 少妇太爽了在线观看免费| 午夜亚洲影院| 国产精品久久久爽爽爽麻豆色哟哟| 国产精品欧美一区二区三区奶水 | 年轻bbwbbw高潮| 欧美一区二区三区四区在线观看| 午夜av男人的天堂| 国产精品亚洲二区| 国产不卡一区在线| 农村妇女毛片精品久久| 日日夜夜亚洲精品| av午夜电影| 国产一区二区二| 亚洲在线久久| 中文字幕在线播放一区| 久久国产精彩视频| 国产精品久久久久四虎| 亚洲一区二区国产精品| 日韩午夜电影院| 精品少妇一区二区三区| 国产精品久久久久99| 精品久久久久久亚洲综合网 | 少妇厨房与子伦在线观看| 欧美资源一区| 久久久99精品国产一区二区三区| 91精品视频一区二区三区| 十八无遮挡| 欧美一区久久久| 欧美777精品久久久久网| 国产精品久久久久久久久久久新郎 | 国产乱xxxxx97国语对白| 一色桃子av| 日韩精品一区二区不卡| 99国产超薄丝袜足j在线观看| 国产伦精品一区二区三区照片91 | 国产在线观看二区| 蜜臀久久99精品久久久 | 色婷婷精品久久二区二区蜜臂av| 精品午夜电影| 亚洲神马久久| 国产日产高清欧美一区二区三区| 国产乱对白刺激视频在线观看| 久久夜色精品亚洲噜噜国产mv| 91香蕉一区二区三区在线观看| 91理论片午午伦夜理片久久| 午夜电影一区| 国产精品9区| 国产馆一区二区| 久久综合久久自在自线精品自| 中文字幕日韩有码| 999久久久国产| 国产乱码精品一区二区三区介绍| 国产三级国产精品国产专区50| 国产一区二区a| www亚洲精品| 亚洲精品少妇一区二区 | 欧美一区二区三区爽大粗免费| 91精品国产91热久久久做人人| 久久久精品久久日韩一区综合| 国产精品一区在线观看你懂的| 日韩精品一区在线观看| 精品一区二区三区影院| 午夜黄色一级电影| 国产精品视频免费一区二区| 97久久国产精品| 国产99久久久久久免费看| 欧美一区二区三区三州| 日韩av不卡一区| 欧美一区二区三区久久| 在线视频国产一区二区| 国产伦精品一区二区三区电影| 99日本精品| 久久国产精品网站| 国产精品一区在线观看你懂的| 国产无遮挡又黄又爽免费网站| 午夜精品在线观看| 欧美一级片一区| 高清国产一区二区 | 亚洲欧洲一区二区| 国产精品久久99| 亚洲精品20p| 国语精品一区| 国产经典一区二区| 国产在线精品一区二区| 丝袜脚交一区二区| 99国产精品九九视频免费看| 久久精品—区二区三区| 美女脱免费看直播| 在线国产二区| 亚洲一区二区福利视频| 国产精品18久久久久久白浆动漫| 久久一二区| 国产精品久久亚洲7777| 91麻豆产精品久久久| 午夜国产一区| 日韩精品一区中文字幕| 国产欧美日韩在线观看| 日本边做饭边被躁bd在线看| 国产亚洲精品久久久456| 欧美亚洲视频二区| 欧美日韩高清一区二区| 国产一区二区极品| 欧美一区二区三区免费播放视频了 | 精品国产一区二区三区久久久久久| 91日韩一区二区三区| 日韩精品福利片午夜免费观看| 国产精品视频tv| 午夜影皖精品av在线播放| 国产91精品一区二区麻豆亚洲| 夜夜嗨av一区二区三区中文字幕| 久久国产欧美一区二区三区免费| 日本精品一区在线| 亚洲欧美一区二区三区三高潮| 在线观看黄色91| 欧美在线观看视频一区二区三区| 国内久久精品视频| 夜色av网站| 国产在线干| 国产资源一区二区| 99久久久久久国产精品| 国产资源一区二区三区| 窝窝午夜理伦免费影院| 好吊色欧美一区二区三区视频 | 国产日韩欧美91| 素人av在线| 欧美日本91精品久久久久| 亚洲欧洲日本在线观看| 日韩欧美高清一区二区| 热99re久久免费视精品频软件| 国产精品偷拍| 亚洲欧美日本一区二区三区| 国产在线拍偷自揄拍视频| 中文字幕一区二区三区又粗| 一区二区三区香蕉视频| 午夜老司机电影| 欧美日韩一区二区三区不卡视频| 精品一区二区超碰久久久| 一区精品二区国产| 一级女性全黄久久生活片免费| 一区二区三区欧美在线| 亚洲欧美日韩精品在线观看| 精品综合久久久久| 91精品系列| 午夜666| 在线观看国产91| 国产在线视频二区| 黄色国产一区二区| 久久伊人色综合| 亚洲码在线| 国产性猛交96| 国产一区第一页| 久久一区二区视频| 视频一区欧美| 久久久久国产精品免费免费搜索| 国产精品对白刺激在线观看| 欧美一级片一区| 亚洲欧美国产一区二区三区 | 99精品免费在线视频| 免费精品99久久国产综合精品应用| 国产高清精品一区| 国产精品99久久久久久宅男| 色噜噜狠狠狠狠色综合久| 国产精品综合一区二区三区| 国产91在| 午夜影院毛片| 免费**毛片| 91av一区二区三区| 精品久久国产视频| 538国产精品一区二区免费视频| 少妇太爽了在线观看免费| 久久午夜鲁丝片|