[發(fā)明專利]一種基于模型自適應(yīng)選擇的多分類(lèi)模型融合方法在審
| 申請(qǐng)?zhí)枺?/td> | 201810876135.2 | 申請(qǐng)日: | 2018-08-03 |
| 公開(kāi)(公告)號(hào): | CN109086825A | 公開(kāi)(公告)日: | 2018-12-25 |
| 發(fā)明(設(shè)計(jì))人: | 高欣;刁新平;何楊;井瀟 | 申請(qǐng)(專利權(quán))人: | 北京郵電大學(xué) |
| 主分類(lèi)號(hào): | G06K9/62 | 分類(lèi)號(hào): | G06K9/62 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 100876 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基分類(lèi)模型 樣本 融合 自適應(yīng)選擇 分類(lèi)模型 多分類(lèi)模型 分類(lèi)準(zhǔn)確率 分類(lèi)標(biāo)簽 分類(lèi)結(jié)果 準(zhǔn)確率 輸出形式 數(shù)據(jù)樣本 樣本設(shè)置 有效融合 結(jié)合基 數(shù)據(jù)集 概率 標(biāo)簽 輸出 | ||
1.一種基于模型自適應(yīng)選擇的多分類(lèi)模型融合方法,其特征在于,所述方法步驟包括:
(1)分別計(jì)算基分類(lèi)模型對(duì)每一類(lèi)樣本的分類(lèi)準(zhǔn)確率,對(duì)結(jié)果輸出為概率值的分類(lèi)模型,取其分類(lèi)結(jié)果的Top-N分類(lèi)標(biāo)簽集;
(2)根據(jù)各基分類(lèi)模型對(duì)每類(lèi)樣本的分類(lèi)準(zhǔn)確率最大值,設(shè)置各類(lèi)樣本的動(dòng)態(tài)準(zhǔn)確率閾值,并對(duì)各數(shù)據(jù)集樣本設(shè)置分類(lèi)結(jié)果融合標(biāo)記;
(3)根據(jù)樣本的融合標(biāo)記,對(duì)每一個(gè)樣本自適應(yīng)選擇參與融合的基分類(lèi)模型,結(jié)合基分類(lèi)模型的Top-N分類(lèi)標(biāo)簽集,實(shí)現(xiàn)基分類(lèi)模型融合。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,分別計(jì)算基分類(lèi)模型對(duì)每一類(lèi)樣本的分類(lèi)準(zhǔn)確率,對(duì)于結(jié)果輸出為概率值的分類(lèi)模型,取其分類(lèi)結(jié)果的Top-N分類(lèi)標(biāo)簽集,具體說(shuō)明如下:基分類(lèi)模型個(gè)數(shù)為2,樣本類(lèi)別數(shù)為M,訓(xùn)練集樣本數(shù)量為n,x為樣本特征向量集,x=[x1 x2 … xn],xi表示第i個(gè)樣本的特征向量,i=1,2,…,n,第k個(gè)基分類(lèi)模型學(xué)習(xí)到的模型為fk(x);若分類(lèi)模型k的輸出結(jié)果為樣本屬于各類(lèi)別的后驗(yàn)概率,則fk(xi)表示模型對(duì)第i個(gè)樣本分類(lèi)結(jié)果中概率的最大值對(duì)應(yīng)的樣本類(lèi)別標(biāo)簽,即其Top-1分類(lèi)標(biāo)簽;若分類(lèi)模型k的輸出為樣本的預(yù)測(cè)類(lèi)標(biāo)簽,則fk(xi)表示分類(lèi)模型k對(duì)第i個(gè)樣本的分類(lèi)標(biāo)簽;ak,j表示第k個(gè)基分類(lèi)模型的輸出結(jié)果中,分類(lèi)標(biāo)簽為第j類(lèi)的樣本預(yù)測(cè)準(zhǔn)確率;用于計(jì)算基分類(lèi)模型對(duì)于每一類(lèi)樣本的分類(lèi)準(zhǔn)確率的表達(dá)式為
其中,I為指示函數(shù),I(j=fk(xi),yi=fk(xi))表示當(dāng)j=fk(xi)且yi=fk(xi)成立時(shí)值為1,否則為0,用于判斷樣本是否被正確分類(lèi)。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)基分類(lèi)模型對(duì)每一個(gè)樣本類(lèi)的分類(lèi)準(zhǔn)確率,分別設(shè)置各類(lèi)樣本的動(dòng)態(tài)準(zhǔn)確率閾值,并對(duì)各數(shù)據(jù)集樣本設(shè)置分類(lèi)結(jié)果融合標(biāo)記,具體說(shuō)明如下:根據(jù)基分類(lèi)模型分類(lèi)結(jié)果對(duì)各類(lèi)別的準(zhǔn)確率,計(jì)算各類(lèi)樣本準(zhǔn)確率閾值σj:
σj=λ·max(a1,j,a2,j),j=1,2,…,M
其中,σj表示第j類(lèi)樣本的準(zhǔn)確率閾值,λ為閾值系數(shù),且滿足λ∈[0,1];
對(duì)分類(lèi)模型預(yù)測(cè)結(jié)果中的各類(lèi)別樣本分別設(shè)置融合標(biāo)記δj:
其中,δj表示第j類(lèi)樣本的融合標(biāo)記;δj=1表示分類(lèi)標(biāo)簽為第j類(lèi)的樣本,分類(lèi)模型1的準(zhǔn)確率明顯高于分類(lèi)模型2,其模型融合后的分類(lèi)結(jié)果取分類(lèi)模型1的分類(lèi)結(jié)果;δj=2表示預(yù)測(cè)為第j類(lèi)的樣本模型融合后輸出結(jié)果取分類(lèi)模型2的分類(lèi)結(jié)果;δj=0表示對(duì)于預(yù)測(cè)結(jié)果標(biāo)簽為第j類(lèi)的樣本,基分類(lèi)模型之間的分類(lèi)準(zhǔn)確率沒(méi)有明顯差別,需要將基分類(lèi)模型的結(jié)果進(jìn)一步判斷以確定最終模型融合后的輸出;
結(jié)合基分類(lèi)模型的分類(lèi)結(jié)果及其結(jié)果中各類(lèi)樣本的融合標(biāo)記,進(jìn)而可得數(shù)據(jù)集各個(gè)樣本的融合標(biāo)記εi:
εi=δj
s.t.f1(xi)=j(luò)
其中,εi表示第i個(gè)樣本的融合標(biāo)記,δj表示第j類(lèi)樣本的融合標(biāo)記,f1(xi)為基分類(lèi)模型1對(duì)第i個(gè)樣本的分類(lèi)結(jié)果,且有i=1,2,…,n,j=1,2,…,M;
即得數(shù)據(jù)集各樣本的模型融合標(biāo)記Θ:
Θ=[ε1 ε2 … εi … εn]。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)各基分類(lèi)模型對(duì)每類(lèi)樣本的分類(lèi)準(zhǔn)確率最大值,設(shè)置各類(lèi)樣本的動(dòng)態(tài)準(zhǔn)確率閾值,并對(duì)各數(shù)據(jù)集樣本設(shè)置分類(lèi)結(jié)果融合標(biāo)記,具體說(shuō)明為:假定分類(lèi)模型1的輸出結(jié)果為將樣本分為各樣本類(lèi)的概率,由分類(lèi)模型1輸出的樣本分別屬于各類(lèi)的概率大小,得分類(lèi)模型1對(duì)該樣本的分類(lèi)結(jié)果中后驗(yàn)概率較大的前N個(gè)分類(lèi)標(biāo)簽集合Top-N;假定表示第k個(gè)分類(lèi)模型輸出的第i個(gè)樣本的Top-N集合中,按后驗(yàn)概率由大到小的第j個(gè)分類(lèi)標(biāo)簽,則有:
其中,n為數(shù)據(jù)集樣本數(shù)量;
假定分類(lèi)模型2學(xué)習(xí)到的模型為f2(x),其學(xué)習(xí)結(jié)果中對(duì)各樣本的分類(lèi)標(biāo)簽為f2(xi);得分類(lèi)模型2對(duì)數(shù)據(jù)集的分類(lèi)結(jié)果F2(x)為:
F2(x)=[f2(x1) f2(x2) … f2(xi) … f2(xn)]
假定分類(lèi)模型融合后,樣本的分類(lèi)結(jié)果輸出為p(xi),由樣本的融合標(biāo)記可得:
其中,f1(xi)=f11(xi),表示分類(lèi)模型1結(jié)果中特征樣本xi所屬類(lèi)別后驗(yàn)概率最大值所對(duì)應(yīng)的類(lèi)別標(biāo)簽;pf(xi)表示融合標(biāo)記εi=0的樣本融合后的輸出標(biāo)簽:
s.t.εi=0,i=1,2,…,n
其中,Top-Ni表示特征樣本xi對(duì)應(yīng)的Top-N集合中的分類(lèi)標(biāo)簽集:
Top-Ni=[f11(xi) f12(xi) … f1j(xi) … f1N(xi)]
可得數(shù)據(jù)集樣本在基分類(lèi)模型學(xué)習(xí)后,利用基于Top-N分類(lèi)標(biāo)簽集的模型融合方法融合之后,可以確定最終輸出的分類(lèi)標(biāo)簽P(x):
P(x)=[p(x1) p(x2) … p(xi) … p(xn)]。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京郵電大學(xué),未經(jīng)北京郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810876135.2/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類(lèi)專利
- 專利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種用于冠心病數(shù)據(jù)的核極限學(xué)習(xí)機(jī)及隨機(jī)森林分類(lèi)方法
- 基于自適應(yīng)異構(gòu)多分類(lèi)模型的釣魚(yú)網(wǎng)站檢測(cè)方法和系統(tǒng)
- 一種基于特征遷移的集成分類(lèi)方法及系統(tǒng)
- 一種基于模型自適應(yīng)選擇的多分類(lèi)模型融合方法
- 基于差分隱私的集成學(xué)習(xí)分類(lèi)方法
- 分類(lèi)模型的訓(xùn)練和使用方法、裝置、設(shè)備和介質(zhì)
- 一種電力序列數(shù)據(jù)分類(lèi)方法和裝置
- 基于集成分類(lèi)模型的分類(lèi)方法及相關(guān)設(shè)備
- 基于加權(quán)的旋轉(zhuǎn)森林高光譜圖像分類(lèi)方法
- 分類(lèi)模型的訓(xùn)練方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 樣本引入裝置、樣本引入基片和樣本引入方法
- 樣本查找方法、裝置及系統(tǒng)
- 模型訓(xùn)練、樣本平衡方法及裝置以及個(gè)人信用評(píng)分系統(tǒng)
- 樣本輸送系統(tǒng)、樣本輸送方法以及樣本檢測(cè)系統(tǒng)
- 樣本分析裝置、樣本檢測(cè)設(shè)備及樣本檢測(cè)方法
- 樣本檢測(cè)方法、樣本檢測(cè)裝置及樣本檢測(cè)系統(tǒng)
- 樣本架、樣本混勻系統(tǒng)及樣本分析儀
- 樣本收集管及樣本收集系統(tǒng)
- 樣本數(shù)據(jù)集的擴(kuò)容方法及模型的訓(xùn)練方法
- 行人重識(shí)別的噪聲樣本識(shí)別方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 一種字幕背景模板自適應(yīng)選擇的方法
- 基于階梯調(diào)制的自適應(yīng)中繼通信方法
- 利用自適應(yīng)選擇的載波頻率的傳感器系統(tǒng)和方法
- 自適應(yīng)地選擇執(zhí)行模式的系統(tǒng)和方法
- 一種自適應(yīng)式多級(jí)諧波隔離裝置
- 一種自適應(yīng)選擇濾光片的方法
- 利用自適應(yīng)選擇的載波頻率的傳感器系統(tǒng)和方法
- 一種基于NR-U下行帶寬自適應(yīng)調(diào)整的數(shù)據(jù)發(fā)送方法及裝置
- 融合視頻特征分析的可伸縮編碼視頻碼率自適應(yīng)選擇方法
- 一種頻率自適應(yīng)的輪椅室內(nèi)定位方法





