[發明專利]一種特征填充方法、裝置、計算設備及介質在審
| 申請號: | 202210048331.7 | 申請日: | 2022-01-17 |
| 公開(公告)號: | CN114492835A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 吳楊;向彪;趙占勝 | 申請(專利權)人: | 中和農信項目管理有限公司 |
| 主分類號: | G06N20/00 | 分類號: | G06N20/00;G06K9/62 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 任敏 |
| 地址: | 100000 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 特征 填充 方法 裝置 計算 設備 介質 | ||
1.一種特征填充方法,其特征在于,包括:
根據目標特征的特征值是否缺失,將數據集中的樣本分為第一未缺失樣本和第一缺失樣本;
確定第一投票分類模型和第二投票分類模型,所述第一投票分類模型和所述第二投票分類模型中分別包括多個分類模型,所述分類模型具有超參數,所述超參數具有相應的參數值;
根據所述第一未缺失樣本和所述第一投票分類模型,確定所述第一缺失樣本的第一預測結果;
基于所述第二投票分類模型和所述第一預測結果,確定所述超參數的第一優選值;
根據所述第一優選值和所述第一投票分類模型,對所述第一缺失樣本進行特征填充。
2.如權利要求1所述方法,其特征在于,所述方法還包括:
根據特征填充的結果得到第二未缺失樣本和第二缺失樣本;
根據所述第二未缺失樣本對所述第二缺失樣本進行特征填充。
3.如權利要求1或2所述的方法,其特征在于,所述根據所述第一未缺失樣本和所述第一投票分類模型,確定所述第一缺失樣本的第一預測結果,包括:
采用所述第一未缺失樣本對所述第一投票分類模型進行訓練;
采用訓練后的所述第一投票分類模型對所述第一缺失樣本進行預測,得到第一預測結果。
4.如權利要求1或2所述的方法,其特征在于,所述超參數包括預測閾值,所述基于所述第二投票分類模型和所述第一預測結果,確定所述超參數的第一優選值,包括:
基于所述超參數,計算所述第一預測結果的預測概率;
確定所述預測概率大于所述預測閾值的第一預測結果為第一預測樣本;
采用所述第一預測樣本和所述未缺失樣本對所述第二投票分類模型進行訓練,得到所述超參數的所述第一優選值。
5.如權利要求4所述的方法,其特征在于,所述根據所述第一優選值和所述第一投票分類模型,對所述第一缺失樣本進行特征填充,包括:
將所述第一優選值作為所述第一投票分類模型的超參數的值;
采用所述第一投票分類模型對所述第一缺失樣本進行預測,得到第二預測結果;
根據所述第二預測結果,對所述第一缺失樣本進行特征填充。
6.如權利要求2所述的方法,其特征在于,所述方法還包括:
若所述目標特征的特征填充完成,則確定所述數據集的下一個待填充特征;
基于所述待填充特征的特征值是否缺失,將所述數據集分為第三未缺失樣本和第三缺失樣本;
根據所述第三未缺失樣本,對所述第三缺失樣本進行填充。
7.如權利要求6所述的方法,其特征在于,所述若所述目標特征的特征填充完成,則確定所述數據集的下一個待填充特征,包括:
確定所述第一缺失樣本的數量和所述第二缺失樣本的數量
若所述第一缺失樣本的數量與所述第二缺失樣本的數量相同,或所述第二缺失樣本的數量為零時,確定所述目標特征的特征填充完成;
確定所述數據集的下一個待填充特征。
8.一種特征填充裝置,其特征在于,包括:
樣本劃分模塊,用于根據目標特征的特征值是否缺失,將數據集中的樣本分為第一未缺失樣本和第一缺失樣本;
投票分類模型確定模塊,用于確定第一投票分類模型和第二投票分類模型,所述第一投票分類模型和所述第二投票分類模型中分別包括多個分類模型,所述分類模型具有超參數,所述超參數具有相應的參數值;
第一預測結果確定模塊,用于根據所述第一未缺失樣本和所述第一投票分類模型,確定所述第一缺失樣本的第一預測結果;
第一優選值確定模塊,用于基于所述第二投票分類模型和所述第一預測結果,確定所述超參數的第一優選值;
特征填充模塊,用于根據所述第一優選值和所述第一投票分類模型,對所述第一缺失樣本進行特征填充。
9.一種計算設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1-7任一項所述的方法。
10.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-7任一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中和農信項目管理有限公司,未經中和農信項目管理有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210048331.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種海洋生態監測裝置及其工作方法
- 下一篇:用于控制空調的方法及裝置、空調





