[發明專利]基于二分類模型的多分類方法、裝置、電子設備及介質在審
| 申請號: | 202110318230.2 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN112801222A | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 龐宇嘉;彭琛;汪偉 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 分類 模型 方法 裝置 電子設備 介質 | ||
1.一種基于二分類模型的多分類方法,其特征在于,所述方法包括:
從原始數據集中抽取出訓練數據集和驗證數據集,并對所述訓練數據集及驗證數據集進行二分類標注;
利用所述訓練數據集構建并訓練二分類模型,并根據所述驗證數據集對所述二分類模型進行驗證調整,得到標準二分類模型;
獲取待處理數據集,將所述待處理數據集輸入至所述標準二分類模型中,得到二分類結果;
對所述標準二分類模型進行解析處理,得到貢獻度矩陣;
按照預設的多分類標注對所述貢獻度矩陣進行聚合處理,得到貢獻度聚合矩陣,并根據所述貢獻度聚合矩陣及所述二分類結果,得到多分類結果。
2.如權利要求1所述的基于二分類模型的多分類方法,其特征在于,所述利用所述訓練數據集構建并訓練二分類模型,包括:
獲取所述訓練數據集和所述訓練數據集對應的二分類標注;
遍歷所述二分類標注中每一個標注,并計算每一個所述標注對所述訓練數據集的基尼指數,得到所述二分類標注對應的基尼指數集合;
對所述基尼指數集合按照從大到小的順序進行排序,選取所述基尼指數集合中最小的基尼指數所對應的標注作為切分點;
以所述切分點作為初始決策樹的根節點,從所述切分點出發生成子節點并將所述訓練數據集分配到所述子節點中,直到將所述二分類標注中的所有標注遍歷完畢,生成所述初始決策樹;
對所述初始決策樹進行剪枝處理,得到二分類模型。
3.如權利要求2所述的基于二分類模型的多分類方法,其特征在于,所述對所述初始決策樹進行剪枝處理,包括:
計算所述初始決策樹上所有非葉子節點的表面誤差增益值;
對所述表面誤差增益值小于預設的增益閾值的非葉子節點進行剪枝。
4.如權利要求1所述的基于二分類模型的多分類方法,其特征在于,所述根據所述驗證數據集對所述二分類模型進行驗證調整,得到標準二分類模型,包括:
利用所述二分類模型對所述驗證數據集進行二分類處理,得到所述驗證數據集對應的分類結果;
當所述驗證數據集對應的分類結果與所述訓練數據集對應的二分類標注不一致時,重新利用所述訓練數據集對所述二分類模型進行訓練,直到所述驗證數據集對應的分類結果與所述訓練數據集對應的二分類標注一致時,將所述訓練完的二分類模型輸出為所述標準二分類模型。
5.如權利要求1所述的基于二分類模型的多分類方法,其特征在于,所述按照預設的多分類標注對所述貢獻度矩陣進行聚合處理,得到貢獻度聚合矩陣,并根據所述貢獻度聚合矩陣及所述二分類結果,得到多分類結果,包括:
按照預設的多分類標注將所述貢獻度矩陣中的每一列劃分為一個類別,按照類別對所述貢獻度矩陣進行縱向加總,得到貢獻度聚合矩陣;
對所述貢獻度聚合矩陣進行縱向歸一化,并乘上所述二分類結果,得到多分類結果。
6.如權利要求1所述的基于二分類模型的多分類方法,其特征在于,所述對所述標準二分類模型進行解析處理,得到貢獻度矩陣,包括:
通過遍歷操作,查找所述標準二分類模型中基于所述二分類標注中每一個標注對應的任意一個節點;
對所述節點進行節點抽取,并提取所述節點的抽取前概率向量和抽取后概率向量;
根據所述抽取前概率向量和所述抽取后概率向量計算所述節點的增益向量;
根據所述標準二分類模型中所有節點的增益向量構建貢獻度矩陣。
7.如權利要求6所述的基于二分類模型的多分類方法,其特征在于,所述根據所述抽取前概率向量和所述抽取后概率向量計算所述節點的增益向量,包括:
利用下述增益向量公式計算所述節點的增益向量:
Δpk,n,i=p′-p
其中,Δpk,n,i為增益向量,p為所述抽取前概率向量,p′為所述抽取后概率向量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110318230.2/1.html,轉載請聲明來源鉆瓜專利網。





