[發(fā)明專利]一種基于模型自適應(yīng)選擇的多分類模型融合方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810876135.2 | 申請(qǐng)日: | 2018-08-03 |
| 公開(kāi)(公告)號(hào): | CN109086825A | 公開(kāi)(公告)日: | 2018-12-25 |
| 發(fā)明(設(shè)計(jì))人: | 高欣;刁新平;何楊;井瀟 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基分類模型 樣本 融合 自適應(yīng)選擇 分類模型 多分類模型 分類準(zhǔn)確率 分類標(biāo)簽 分類結(jié)果 準(zhǔn)確率 輸出形式 數(shù)據(jù)樣本 樣本設(shè)置 有效融合 結(jié)合基 數(shù)據(jù)集 概率 標(biāo)簽 輸出 | ||
本發(fā)明實(shí)施例提出了一種基于模型自適應(yīng)選擇的多分類模型融合方法,包括:分別計(jì)算基分類模型對(duì)每一類樣本的分類準(zhǔn)確率,對(duì)結(jié)果輸出為概率值的分類模型,取其分類結(jié)果的Top?N分類標(biāo)簽集;根據(jù)各基分類模型對(duì)每類樣本的分類準(zhǔn)確率最大值,設(shè)置各類樣本的動(dòng)態(tài)準(zhǔn)確率閾值,并對(duì)各數(shù)據(jù)集樣本設(shè)置分類結(jié)果融合標(biāo)記;根據(jù)樣本的融合標(biāo)記,對(duì)每一個(gè)樣本自適應(yīng)選擇參與融合的基分類模型,結(jié)合基分類模型的Top?N分類標(biāo)簽集,實(shí)現(xiàn)基分類模型融合。本發(fā)明實(shí)施例提供的技術(shù)方案,可以將結(jié)果輸出形式分別為概率值和樣本所屬類標(biāo)簽的兩個(gè)基分類模型進(jìn)行有效融合,能針對(duì)每一個(gè)數(shù)據(jù)樣本實(shí)現(xiàn)基分類模型的自適應(yīng)選擇,提高融合之后分類模型的準(zhǔn)確率。
【技術(shù)領(lǐng)域】
本發(fā)明涉及機(jī)器學(xué)習(xí)領(lǐng)域解決多分類問(wèn)題時(shí)的分類模型融合方法,尤其涉及一種兩個(gè)基分類模型輸出形式分別為概率值和類別標(biāo)簽的多分類模型融合方法。
【背景技術(shù)】
在將多個(gè)分類模型融合以解決多分類問(wèn)題時(shí),需要綜合基分類模型的學(xué)習(xí)結(jié)果來(lái)決定融合后分類模型的輸出。利用數(shù)據(jù)挖掘技術(shù)解決多分類問(wèn)題,綜合多個(gè)基分類模型的學(xué)習(xí)結(jié)果實(shí)現(xiàn)信息互補(bǔ)以進(jìn)一步提升分類模型的性能,是當(dāng)今研究的熱點(diǎn)之一。目前在對(duì)基分類模型結(jié)果進(jìn)行融合時(shí),常用的模型融合方法主要包括最值法、求和法、均值法、投票法,考慮到不同分類模型的決策性能不同,通常在對(duì)基分類模型結(jié)果進(jìn)行融合時(shí)會(huì)對(duì)不同的分類模型結(jié)果設(shè)置權(quán)值,從而更好的保證融合后分類模型性能的提升。最值法、求和法和均值法在進(jìn)行模型融合時(shí),其要求基分類模型的結(jié)果輸出形式必須是數(shù)據(jù)樣本屬于每一樣本類別的概率值,而對(duì)于輸出結(jié)果為樣本類別標(biāo)簽的基分類模型并不適用;在利用投票法進(jìn)行模型融合時(shí),其對(duì)基分類模型的結(jié)果輸出形式?jīng)]有限制,但是其少數(shù)服從多數(shù)的決策機(jī)制決定了其只能適用于基分類模型個(gè)數(shù)不少于三個(gè)的情況。考慮到現(xiàn)有的模型融合方法對(duì)基分類模型結(jié)果輸出形式及基分類模型個(gè)數(shù)的限制,對(duì)于兩個(gè)基分類模型的輸出分別為概率值和樣本標(biāo)簽的情況,現(xiàn)有的模型融合方法并不能有效適用。當(dāng)分類模型輸出結(jié)果為將樣本屬于各類別的概率時(shí),可以通過(guò)比較分類模型將樣本分為各類的概率大小,獲取該分類模型對(duì)該樣本的前N個(gè)分類標(biāo)簽,以下簡(jiǎn)稱為Top-N分類標(biāo)簽集。
【發(fā)明內(nèi)容】
有鑒于此,本發(fā)明實(shí)施例提出了一種基于模型自適應(yīng)選擇的多分類模型融合方法,可以解決現(xiàn)有融合算法對(duì)基分類模型的限制,并針對(duì)每一個(gè)數(shù)據(jù)樣本實(shí)現(xiàn)對(duì)基分類模型的自適應(yīng)選擇。
本發(fā)明實(shí)施例提出的一種基于模型自適應(yīng)選擇的多分類模型融合方法,包括:
分別計(jì)算基分類模型對(duì)于每一類樣本的分類準(zhǔn)確率,對(duì)結(jié)果輸出為概率值的分類模型,取其分類結(jié)果的Top-N分類標(biāo)簽集;
根據(jù)各基分類模型對(duì)每類樣本的分類準(zhǔn)確率最大值,設(shè)置各類樣本的動(dòng)態(tài)準(zhǔn)確率閾值,并對(duì)各數(shù)據(jù)集樣本設(shè)置分類結(jié)果融合標(biāo)記;
根據(jù)樣本的融合標(biāo)記,對(duì)每一個(gè)樣本自適應(yīng)選擇參與融合的基分類模型,結(jié)合基分類模型的Top-N分類標(biāo)簽集,實(shí)現(xiàn)基分類模型融合。
上所述方法中,分別計(jì)算基分類模型對(duì)每一類樣本的分類準(zhǔn)確率,對(duì)于結(jié)果輸出為概率值的分類模型,取其分類結(jié)果的Top-N分類標(biāo)簽集的方法為:基分類模型個(gè)數(shù)為2,樣本類別數(shù)為M,訓(xùn)練集樣本數(shù)量為n,x為樣本特征向量集,x=[x1 x2 … xn],xi表示第i個(gè)樣本的特征向量,i=1,2,…,n,第k個(gè)基分類模型學(xué)習(xí)到的模型為fk(x);若分類模型k的輸出結(jié)果為樣本屬于各類別的后驗(yàn)概率,則fk(xi)表示模型對(duì)第i個(gè)樣本分類結(jié)果中概率的最大值對(duì)應(yīng)的樣本類別標(biāo)簽,即其Top-1分類標(biāo)簽;若分類模型k的輸出為樣本的預(yù)測(cè)類標(biāo)簽,則fk(xi)表示分類模型k對(duì)第i個(gè)樣本的分類標(biāo)簽。ak,j表示第k個(gè)基分類模型的輸出結(jié)果中,分類標(biāo)簽為第j類的樣本預(yù)測(cè)準(zhǔn)確率。用于計(jì)算基分類模型對(duì)于每一類樣本的分類準(zhǔn)確率的表達(dá)式為
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810876135.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種用于冠心病數(shù)據(jù)的核極限學(xué)習(xí)機(jī)及隨機(jī)森林分類方法
- 基于自適應(yīng)異構(gòu)多分類模型的釣魚(yú)網(wǎng)站檢測(cè)方法和系統(tǒng)
- 一種基于特征遷移的集成分類方法及系統(tǒng)
- 一種基于模型自適應(yīng)選擇的多分類模型融合方法
- 基于差分隱私的集成學(xué)習(xí)分類方法
- 分類模型的訓(xùn)練和使用方法、裝置、設(shè)備和介質(zhì)
- 一種電力序列數(shù)據(jù)分類方法和裝置
- 基于集成分類模型的分類方法及相關(guān)設(shè)備
- 基于加權(quán)的旋轉(zhuǎn)森林高光譜圖像分類方法
- 分類模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種字幕背景模板自適應(yīng)選擇的方法
- 基于階梯調(diào)制的自適應(yīng)中繼通信方法
- 利用自適應(yīng)選擇的載波頻率的傳感器系統(tǒng)和方法
- 自適應(yīng)地選擇執(zhí)行模式的系統(tǒng)和方法
- 一種自適應(yīng)式多級(jí)諧波隔離裝置
- 一種自適應(yīng)選擇濾光片的方法
- 利用自適應(yīng)選擇的載波頻率的傳感器系統(tǒng)和方法
- 一種基于NR-U下行帶寬自適應(yīng)調(diào)整的數(shù)據(jù)發(fā)送方法及裝置
- 融合視頻特征分析的可伸縮編碼視頻碼率自適應(yīng)選擇方法
- 一種頻率自適應(yīng)的輪椅室內(nèi)定位方法





