[發明專利]基于組合模型的分類方法、裝置、設備及存儲介質有效
| 申請號: | 202110196084.0 | 申請日: | 2021-02-22 |
| 公開(公告)號: | CN112561000B | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 鐘子宏 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00;G06Q30/02;G06Q30/06 |
| 代理公司: | 北京勵誠知識產權代理有限公司 11647 | 代理人: | 趙爽 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 組合 模型 分類 方法 裝置 設備 存儲 介質 | ||
1.一種基于組合模型的分類方法,其特征在于,包括:
獲取m組訓練樣本和n組預測數據,m和n均為正整數;
通過所述m組訓練樣本對m個模型分別進行訓練,以得到m個目標模型;
針對所述m個目標模型中的任一個目標模型,根據所述目標模型、所述目標模型對應的第一訓練樣本組和所述第一訓練樣本組對應的分類閾值,得到所述第一訓練樣本組中各個訓練樣本的第一分類標簽;并根據所述各個訓練樣本的第一分類標簽和所述第一訓練樣本組中各個訓練樣本包括的第二分類標簽,得到所述目標模型對應的分類標簽方差;
根據所述m個目標模型和所述m個目標模型各自對應的分類標簽方差,得到組合模型;
根據所述n組預測數據、所述組合模型和所述n組預測數據分別對應的分類閾值,得到所述n組預測數據中每個預測數據的分類標簽。
2.根據權利要求1所述的方法,其特征在于,所述根據所述目標模型、所述目標模型對應的第一訓練樣本組和所述第一訓練樣本組對應的分類閾值,得到所述第一訓練樣本組中各個訓練樣本的第一分類標簽之前,還包括:
根據所述目標模型、所述第一訓練樣本組的均值向量和所述第一訓練樣本組中訓練樣本的數量,確定所述第一訓練樣本組對應的分類閾值。
3.根據權利要求1或2所述的方法,其特征在于,所述根據所述目標模型、所述目標模型對應的第一訓練樣本組和所述第一訓練樣本組對應的分類閾值,得到所述第一訓練樣本組中各個訓練樣本的第一分類標簽,包括:
針對所述m個目標模型中的任一個目標模型,將所述目標模型對應的第一訓練樣本組和所述目標模型輸入邏輯回歸LR模型中,以得到所述第一訓練樣本組中各個訓練樣本的得分概率;
根據所述第一訓練樣本組中各個訓練樣本的得分概率和所述第一訓練樣本組對應的分類閾值,得到所述第一訓練樣本組中各個訓練樣本的第一分類標簽。
4.根據權利要求3所述的方法,其特征在于,所述根據所述第一訓練樣本組中各個訓練樣本的得分概率和所述第一訓練樣本組對應的分類閾值,得到所述第一訓練樣本組中各個訓練樣本的第一分類標簽,包括:
針對所述第一訓練樣本組中的任一訓練樣本,若所述訓練樣本的得分概率大于所述第一訓練樣本組對應的分類閾值,則確定所述訓練樣本的第一分類標簽為1;
若所述訓練樣本的得分概率小于或等于所述第一訓練樣本組對應的分類閾值,則確定所述訓練樣本的第一分類標簽為0。
5.根據權利要求1或2所述的方法,其特征在于,所述根據所述m個目標模型和所述m個目標模型各自對應的分類標簽方差,得到組合模型,包括:
對所述m個目標模型各自對應的分類標簽方差按照由小到大的順序進行重排;
對所述m個目標模型按照由大到小的順序進行重排;
對重排后的所述m個目標模型各自對應的分類標簽方差和重排后的所述m個目標模型依次相乘并相加,以得到第一求和結果;
對所述m個目標模型各自對應的分類標簽方差求和,以得到第二求和結果;
對所述第一求和結果和所述第二求和結果作商,以得到所述組合模型。
6.根據權利要求1所述的方法,其特征在于,所述根據所述m個目標模型和所述m個目標模型各自對應的分類標簽方差,得到組合模型之前,還包括:
獲取m組測試樣本;
分別通過所述m組測試樣本對所述m個目標模型進行測試;
所述根據所述m個目標模型和所述m個目標模型各自對應的分類標簽方差,得到組合模型,包括:
當對所述m個目標模型測試成功時,根據所述m個目標模型和所述m個目標模型各自對應的分類標簽方差,得到組合模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110196084.0/1.html,轉載請聲明來源鉆瓜專利網。





