[發明專利]特征組合方法、裝置、介質和電子設備有效
| 申請號: | 202010324927.6 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111221880B | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 張昊立;劉昭呈;劉強 | 申請(專利權)人: | 北京瑞萊智慧科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N3/04;G06N3/08 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 郭棟梁 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 組合 方法 裝置 介質 電子設備 | ||
本申請提供了一種特征組合方法、裝置、介質和電子設備,該方法包括:以包括多個不同特征域的多個樣本作為神經網絡模型的輸入,獲取多個樣本中各特征域對應的解釋向量;對解釋向量符合預設條件的特征域進行標注,其中,所述預設條件包括解釋向量的絕對值大于設定閾值;根據各特征域被標注的頻數從多到少的順序,依次選取預設數量的組合特征域,作為候選組合特征域;從多個候選組合特征域中選取與目標模型匹配的目標組合特征域。本申請通過獲取多個不同特征域各自對應的解釋向量,從而篩選出對神經網絡模型的輸出結果的影響較佳的候選組合特征域,縮小組合特征域的選取范圍,降低組合特征域的篩選復雜度,并且最終得到的組合特征域具備可解釋性。
技術領域
本發明涉及計算機技術領域,尤其涉及一種特征組合方法、裝置、介質和電子設備。
背景技術
自動機器學習技術因其不需要對數據進行深入挖掘,就可以實現自動化數據處理及建模的特點,正逐步引起各領域的關注。采用自動機器學習技術進行建模時,組合特征的選取對神經網絡模型準確性具有顯著影響。組合特征是由多個不同特征域交叉構成的。
目前,選取組合特征時大多采用互信息完全搜索策略、暴力搜索策略、深度模型點積策略中的一種來實現特征域交互,從而搜索出神經網絡模型為預測對象進行預測時所需要的特征組合。但是,互信息完全搜索策略僅利用互信息值作為組合特征的篩選條件,不僅缺乏泛化性,只適用于部分分類任務,還使得組合特征難以提升模型預測效果。而暴力搜索策略需要遍歷的組合特征過多,不僅該策略失敗率高,還導致時間開銷大。深度模型點積策略篩選出的組合特征復雜度高,難以被人類理解,不具備可解釋性。
因此,如何搜索出需要使用的組合特征,成為亟待解決的技術問題。
發明內容
本發明實施例提供一種特征組合方法、裝置、介質和電子設備,用以搜索出需要使用的目標組合特征,提升目標模型的準確性。
第一方面,本發明實施例提供一種特征組合方法,該方法包括:
以包括多個不同特征域的多個樣本作為神經網絡模型的輸入,獲取所述多個樣本中各特征域對應的解釋向量;
對解釋向量符合預設條件的特征域進行標注,其中,所述預設條件包括解釋向量的絕對值大于設定閾值;
根據各特征域被標注的頻數從多到少的順序,依次選取預設數量的組合特征域,作為候選組合特征域;
從多個候選組合特征域中選取與目標模型匹配的目標組合特征域。
第二方面,本發明實施例提供一種特征組合裝置,該裝置包括:
獲取模塊,被配置為以包括多個不同特征域的多個樣本作為神經網絡模型的輸入,獲取所述多個樣本中各特征域對應的解釋向量;根據各特征域對應的解釋向量得到多個候選組合特征域;
選取模塊,被配置為從所述多個候選組合特征域中選取與目標模型匹配的目標組合特征域;
在根據各特征域對應的解釋向量得到多個候選組合特征域的過程中,所述獲取模塊具體被配置為:
對解釋向量符合預設條件的特征域進行標注,其中,所述預設條件包括解釋向量的絕對值大于設定閾值;
根據各特征域被標注的頻數從多到少的順序,依次選取預設數量的組合特征域,作為候選組合特征域。
第三方面,本發明實施例提供一種電子設備,其中包括處理器和存儲器,其中,所述存儲器上存儲有可執行代碼,當所述可執行代碼被所述處理器執行時,使所述處理器至少可以實現第一方面中的特征組合方法。
第四方面,本發明實施例提供了一種介質,所述介質上存儲有計算機可執行指令,當所述可執行指令被電子設備的處理器執行時,使所述處理器至少可以實現第一方面中的特征組合方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京瑞萊智慧科技有限公司,未經北京瑞萊智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010324927.6/2.html,轉載請聲明來源鉆瓜專利網。





