[發明專利]特征組合方法、裝置、介質和電子設備有效
| 申請號: | 202010324927.6 | 申請日: | 2020-04-23 |
| 公開(公告)號: | CN111221880B | 公開(公告)日: | 2021-01-22 |
| 發明(設計)人: | 張昊立;劉昭呈;劉強 | 申請(專利權)人: | 北京瑞萊智慧科技有限公司 |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N3/04;G06N3/08 |
| 代理公司: | 北京志霖恒遠知識產權代理事務所(普通合伙) 11435 | 代理人: | 郭棟梁 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 特征 組合 方法 裝置 介質 電子設備 | ||
1.一種特征組合方法,其中,包括:
以包括多個不同特征域的多個樣本作為神經網絡模型的輸入,獲取所述多個樣本中各特征域對應的解釋向量,包括:
從所述神經網絡模型中提取所述多個樣本中各特征域的隱含向量;
將每個樣本的隱含向量轉換為對應樣本中各特征域對應的解釋向量,包括:
對每一樣本中各特征域對應的隱含向量進行預設處理,得到每一樣本中各特征域對應的局部解釋向量;或者
對每一樣本中各特征域對應的隱含向量進行預設處理,并將每一樣本中各特征域對應的局部解釋向量與全體解釋向量進行求差值計算,得到每一樣本中各特征域對應的標準解釋向量;
其中,所述全體解釋向量為各特征域對應的局部解釋向量的平均值;
其中,所述包括多個不同特征域的多個樣本至少包括用戶購物數據、零售數據和農作物種植數據中的一種;每一樣本包括多個不同的組合特征域;
對解釋向量符合預設條件的特征域進行標注,其中,所述預設條件包括解釋向量的絕對值大于設定閾值;
根據各特征域被標注的情況確定各個組合特征域的標注頻數;
根據各組合特征域被標注的頻數從多到少的順序,依次選取預設數量的多個組合特征域,作為候選組合特征域;
從多個候選組合特征域中選取與目標模型匹配的目標組合特征域。
2.根據權利要求1所述的方法,其中,各特征域對應的解釋向量用于反映每個樣本中各特征域對所述神經網絡模型輸出結果的影響程度。
3.根據權利要求2所述的方法,其中,所述從所述神經網絡模型中提取每個樣本的隱含向量,包括:
通過所述神經網絡模型的嵌入層輸出每個樣本中各特征域對應的隱含向量。
4.根據權利要求1所述的方法,其中,所述從多個候選組合特征域中選取與目標模型匹配的目標組合特征域,包括:
以初始特征值作為所述目標模型的輸入,獲取所述目標模型的第一輸出值;
以任一候選組合特征域中的組合特征值與所述初始特征值作為所述目標模型的輸入,獲取所述目標模型的第二輸出值;
若所述第二輸出值優于所述第一輸出值,則將該候選組合特征域確定為所述目標組合特征域。
5.根據權利要求4所述的方法,其中,所述目標模型為邏輯回歸模型;若以初始特征值作為所述目標模型的輸入,則所述邏輯回歸模型f1的公式表達為:
f1(x)=sigmoid(a1x1+a2x2+···+afxf)
其中,xf表示在第f個特征域中的初始特征值,af表示該初始特征值的權重,Sigmoid表示激活函數,f為正整數。
6.根據權利要求4所述的方法,其中,所述目標模型為邏輯回歸模型;若以任一候選組合特征域中的組合特征值與所述初始特征值作為所述目標模型的輸入,則所述邏輯回歸模型f2的公式表達為:
f2(x)=sigmoid(a1x1+a2x2+···+afxf+afi,fjxfi,fj)
其中,xfi,fj表示第i個特征域和第j個特征域構成的候選組合特征域中的組合特征值,afi,fj表示組合特征值的權重,xf表示在第f個特征域中的初始特征值,af表示該初始特征值的權重,Sigmoid表示激活函數,f為正整數。
7.根據權利要求1-6中任一所述的方法,其中,選取出的目標組合特征域的階數不超過設定階數范圍。
8.根據權利要求1所述的方法,其中,預設數量為特征域數量的二倍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京瑞萊智慧科技有限公司,未經北京瑞萊智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010324927.6/1.html,轉載請聲明來源鉆瓜專利網。





