[發明專利]基于改進Adaboost算法的數據源分類器構建方法在審
| 申請號: | 201810318399.6 | 申請日: | 2018-04-11 |
| 公開(公告)號: | CN108537279A | 公開(公告)日: | 2018-09-14 |
| 發明(設計)人: | 裘嶸;何文婷;張祖平 | 申請(專利權)人: | 中南大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 長沙市融智專利事務所 43114 | 代理人: | 龔燕妮 |
| 地址: | 410083 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據源 分類器構建 弱分類器 分類器 改進 強弱 并行訓練 強分類器 算法 疊加 分類 | ||
1.一種基于改進Adaboost算法的數據源分類器構建方法,其特征在于,包括:
步驟S1:根據歷史分類數據構建樣本數據集,并設置樣本數據集中每一組訓練樣本數據的初始樣本權重值;
步驟S2:根據樣本數據集抽取訓練集;
步驟S3:采用所述訓練集分別訓練弱分類器和強分類器,并獲取兩個分類器各自的錯誤度;
步驟S4:當步驟S3得到的兩個分類器各自的錯誤度均大于預設閾值時,返回步驟S3;
步驟S5:根據兩個分類器各自的錯誤度分別設置兩個分類器各自的分類器權重值;
步驟S6:當本輪迭代訓練得到的兩個分類器各自的錯誤度均大于上一輪迭代訓練得到的兩個分類器各自的錯誤度時,根據本輪迭代訓練之前的各輪迭代訓練得到的分類器及其分類器權重值整合獲得最終分類器;否則,重新設置每一組訓練樣本數據的樣本權重值,并返回步驟S3。
2.根據權利要求1所述的方法,其特征在于,所述步驟S1中的樣本數據集為D={(X1,y1),(X2,y2),...,(Xi,yi),...,(Xm,ym)},將其中每一組訓練樣本數據的初始樣本權重值設置為
其中,t表示第t輪迭代訓練,i為訓練樣本數據組序號,m為樣本數據集中的訓練樣本數據組總數,t、i和m均為正整數,Xi表示每一組樣本數據中包含的待分類的數據源類別,yi表示每一組樣本數據中分類正確的數據源類別。
3.根據權利要求2所述的方法,其特征在于,所述步驟S2為:
從所述樣本數據集D中按照預設抽樣比例隨機抽取訓練樣本數據組構建訓練集S;
其中,所述預設抽樣比例的取值范圍為20%到80%。
4.根據權利要求3所述的方法,其特征在于,所述步驟S3中錯誤度的獲取方法為:
弱分類器hp錯誤度為強分類器hs錯誤度為
其中,hp(Xi)≠yi表示弱分類器hp對第i個訓練樣本數據組分類錯誤,P(hp(Xi)≠yi)表示本輪迭代訓練中弱分類器hp分類錯誤樣本數據組的樣本權重值總和,hs(Xi)≠yi表示弱分類器hs對第i個訓練樣本數據組分類錯誤,P(hs(Xi)≠yi)表示本輪迭代訓練中強分類器分類錯誤樣本數據組的樣本權重值總和。
5.根據權利要求4所述的方法,其特征在于,所述步驟S4中的預設閾值為0.5。
6.根據權利要求5所述的方法,其特征在于,所述步驟S5為:
根據所述弱分類器錯誤度εp設置弱分類器hp的分類器權重值αp為
根據所述強分類器錯誤度εs設置強分類器hs的分類器權重值αs為
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中南大學,未經中南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810318399.6/1.html,轉載請聲明來源鉆瓜專利網。





