[發明專利]特征篩選方法、裝置及電子設備在審
| 申請號: | 202310083022.8 | 申請日: | 2023-01-19 |
| 公開(公告)號: | CN116012849A | 公開(公告)日: | 2023-04-25 |
| 發明(設計)人: | 徐靖宇;劉昊騁;徐世界;王天祺 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V30/18 | 分類號: | G06V30/18;G06N20/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 石茵汀 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 篩選 方法 裝置 電子設備 | ||
1.一種特征篩選方法,包括:
獲取參考樣本集合,以及所述參考樣本集合對應的至少一個打亂樣本集合;所述參考樣本集合包括,至少一個樣本特征序列以及所述樣本特征序列對應的標簽;所述打亂樣本集合為對所述參考樣本集合中標簽進行打亂處理后得到的;
將所述參考樣本集合輸入特征重要度模型,對所述特征重要度模型進行訓練,得到一個參考重要度模型;
將至少一個所述打亂樣本集合分別輸入所述特征重要度模型,對所述特征重要度模型進行訓練,得到至少一個打亂重要度模型;
根據所述參考重要度模型輸出的參考特征重要度序列以及至少一個所述打亂重要度模型輸出的打亂特征重要度序列,對所述樣本特征序列中多個維度的特征進行篩選處理,獲取至少一個維度的有效特征。
2.根據權利要求1所述的方法,其中,所述獲取參考樣本集合,以及所述參考樣本集合對應的至少一個打亂樣本集合,包括:
獲取所述參考樣本集合;
對所述參考樣本集合中至少一個所述樣本特征序列對應的標簽進行打亂處理,得到一個打亂樣本集合;
重復打亂處理步驟,得到至少一個所述打亂樣本集合。
3.根據權利要求2所述的方法,其中,所述對所述參考樣本集合中至少一個所述樣本特征序列對應的標簽進行打亂處理,得到一個打亂樣本集合,包括:
針對所述參考樣本集合中的每個目標樣本特征序列,獲取所述目標樣本特征序列對應的目標標簽;所述目標樣本特征序列,為所述參考樣本集合中的全部樣本特征序列,或者,為所述參考樣本集合中的部分樣本特征序列;
采用所述參考樣本集合中除所述目標標簽之外的標簽,對所述目標標簽進行替換處理,得到所述目標樣本特征序列對應的打亂后標簽;
根據所述目標樣本特征序列以及所述目標樣本特征序列對應的打亂后標簽,生成所述打亂樣本集合。
4.根據權利要求1所述的方法,其中,所述根據所述參考重要度模型輸出的參考特征重要度序列以及至少一個所述打亂重要度模型輸出的打亂特征重要度序列,對所述樣本特征序列中多個維度的特征進行篩選處理,獲取至少一個維度的有效特征,包括:
根據至少一個所述打亂特征重要度序列,確定打亂特征重要度均值序列;
根據所述打亂特征重要度均值序列以及所述參考特征重要度序列,確定多個維度上的特征相關度指標;
根據多個所述維度上的特征相關度指標,對所述樣本特征序列中多個所述維度的特征進行篩選處理,獲取至少一個所述維度的有效特征。
5.根據權利要求4所述的方法,其中,所述根據所述打亂特征重要度均值序列以及所述參考特征重要度序列,確定多個維度上的特征相關度指標,包括:
針對每個維度,獲取所述打亂特征重要度均值序列中所述維度上的打亂特征重要度均值,以及所述參考特征重要度序列中所述維度上的參考特征重要度;
確定所述參考特征重要度與所述打亂特征重要度均值的比值;
對所述比值進行對數處理,得到所述維度上的特征相關度指標。
6.根據權利要求4所述的方法,其中,所述根據多個所述維度上的特征相關度指標,對所述樣本特征序列中多個所述維度的特征進行篩選處理,獲取至少一個所述維度的有效特征,包括:
針對每個維度,在所述維度上的特征相關度指標大于或者等于預設數量閾值的情形下,確定所述維度為待保留維度;
將至少一個所述待保留維度的特征,確定為有效特征。
7.根據權利要求1所述的方法,其中,所述方法還包括:
根據至少一個所述維度的有效特征,對所述樣本特征序列進行特征更新處理,得到所述樣本特征序列對應的更新后樣本特征序列;
根據所述參考樣本集合中至少一個所述樣本特征序列對應的更新后樣本特征序列,以及所述樣本特征序列對應的標簽,生成目標樣本集合;
采用所述目標樣本集合對初始分類模型進行訓練,得到訓練好的分類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310083022.8/1.html,轉載請聲明來源鉆瓜專利網。





