[發明專利]一種基于互信息和改進遺傳算法的用戶屬性特征選擇方法在審
| 申請號: | 202110292490.7 | 申請日: | 2021-03-18 |
| 公開(公告)號: | CN112906890A | 公開(公告)日: | 2021-06-04 |
| 發明(設計)人: | 曹倩;左敏;姜同強;麻春蕊;王曼 | 申請(專利權)人: | 北京工商大學 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12;G06K9/62;G06Q30/02 |
| 代理公司: | 北京永創新實專利事務所 11121 | 代理人: | 易卜 |
| 地址: | 100048*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 互信 改進 遺傳 算法 用戶 屬性 特征 選擇 方法 | ||
1.一種基于互信息和改進遺傳算法的用戶屬性特征選擇方法,其特征在于,包括以下步驟:
步驟一、海量采集手機用戶,對各用戶的性別及年齡段設為標簽sex_age;同時,根據用戶使用的APP統計用戶特征,將每個標簽下的用戶特征構成原始特征集;
每個標簽sex_age都對應M個特征,特征集合為F={f1,f2,…,fi,....fM};最終所有標簽的所有特征集合構成了原始特征集;
步驟二、利用互信息算法計算每個標簽和對應的各個特征之間的互信息;
步驟三、將每個標簽對應的所有互信息,按照由大到小的順序對各特征進行排序,并將互信息大于閾值Q對應的特征篩選到特征集F'中,作為遺傳算法的初始種群;同時,在初始種群中生成若干隨機特征,并給每個特征賦值;
閾值Q根據實際需求人為設定;
在初始種群中,互信息值大于閾值Q的特征均設為1,隨機生成的特征隨機設為0或1;
步驟四、采用二進制編碼方式對初始種群中的特征進行編碼,形成種群的個體;
初始種群中的每個個體是由L個特征對應的0或1組成的二進制字符串,L為候選特征的總數量;
針對每個個體,依次判斷當前第i位的值是否為0,如果是,表示不選擇第i位對應的特征fi,否則,值為1表示選擇特征fi;
步驟五、根據基于類內類間距離的適應度函數,計算初始種群中每個個體的適應度;
步驟六、利用輪盤賭的比例選擇法,對種群中的每個個體按照適應度值計算選擇概率,將選中的個體進入下一代種群;
步驟七、對于選中進入下一代進行遺傳操作的個體,根據自適應的交叉、變異算子進行交叉、變異操作,產生新一代種群;
令交叉概率和變異概率分別記為pc和pm,計算公式為:
其中,pc1、pc2、pm1和pm2為常數,fmax表示當前代種群中所有個體中的最大適應度值,favg表示每一代中所有個體的適應度平均值,f′表示要進行交叉操作的雙親之間較大的適應度值,f表示要進行變異操作的個體的適應度值;
步驟八、計算新一代種群中每個個體的適應度,并判斷新一代種群是否達到終止條件,如果是,則輸出最優特征子集;否則,返回步驟六;
最優特征子集是指,新一代種群中每個個體中值為1的特征組成的集合;
終止條件為:適應度最優解連續5次保持不變或迭代次數達到最大值。
2.如權利要求1所述的一種基于互信息和改進遺傳算法的用戶屬性特征選擇方法,其特征在于,所述的步驟一中,sex表示用戶性別,取值1、2分別表示男和女;age表示用戶年齡段,取值0-10分別對應用戶不同的年齡段;
用戶特征包括:每個用戶的App安裝特征、App使用特征、用戶App使用偏好特征以及Applist2vec特征。
3.如權利要求1所述的一種基于互信息和改進遺傳算法的用戶屬性特征選擇方法,其特征在于,步驟二中所述互信息的計算具體為:
針對離散隨機變量標簽X,以及該標簽X對應的某個特征Y,互信息I(X;Y)為:
H(X)表示變量標簽X的熵,S為變量標簽X的取值范圍;p(x)是變量標簽X的概率密度分布函數;
H(X|Y)表示條件熵,用來對已知變量Y后X取值的不確定性進行度量,表示為:
p(x,y)是變量標簽X和變量標簽Y的聯合概率密度分布函數;T為變量標簽Y的取值范圍;p(x|y)代表當變量Y取值為y時,X取值為x的概率;
由此,得到標簽X下的M個特征對應的M個互信息結果。
4.如權利要求1所述的一種基于互信息和改進遺傳算法的用戶屬性特征選擇方法,其特征在于,所述步驟七中每個個體被選中的概率與其適應度大小成正比,針對個體xi進入到下一代進行遺傳操作的概率p(xi)如下式:
其中n為個體的數量,個體xi的適應度為f(xi)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京工商大學,未經北京工商大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110292490.7/1.html,轉載請聲明來源鉆瓜專利網。





