[發明專利]基于標簽相關性的多標簽流特征確定最優特征子集的方法在審
| 申請號: | 202110680679.3 | 申請日: | 2021-06-18 |
| 公開(公告)號: | CN113344091A | 公開(公告)日: | 2021-09-03 |
| 發明(設計)人: | 尤殿龍;王楊 | 申請(專利權)人: | 燕山大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 北京孚睿灣知識產權代理事務所(普通合伙) 11474 | 代理人: | 劉翠芹 |
| 地址: | 066004 河北省*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 標簽 相關性 特征 確定 最優 子集 方法 | ||
1.一種基于標簽相關性的多標簽流特征確定最優特征子集的方法,其特征在于,其包括如下步驟:
步驟S1、將多個標簽定義為標簽集L,其中lj∈L,lj為L中的第j個標簽,0≤j≤m,m為標簽的個數;
步驟S2、計算標簽集L中每個標簽的重要性權重LW(lj),其具體包括以下子步驟:
S21、根據互信息計算兩個標簽之間的相關性w(li;lj),將兩個相同的標簽之間的互信息設為0,即當i=j時,w(li;lj)=0;根據互信息計算兩個標簽之間的相關性w(li;lj)的公式如下:
式中,MI(·,·)表示互信息,P(·,·)表示聯合概率分布函數,P(·|·)表示條件概率分布函數,P(·)表示邊緣概率分布函數,1≤k≤N,1≤q≤N,N表示實例的個數,lik表示標簽li對應的實例是xk,xk=[x1,x2,…,xd],xk表示d維向量,ljq表示標簽lj對應的實例是xq,xq=[x1,x2,…,xd],xq表示d維向量;
S22、將各個標簽作為節點,構建加權無向圖WUG,將兩個標簽之間的相關性的值作為加權無向圖WUG中兩個節點之間的邊上的權重;
S23、根據構建的加權無向圖WUG,利用以下公式計算每個標簽的重要性權重LW(lj):
式中,SW(lj)表示各個標簽和標簽lj的互信息求和,LW(li)和LW(lj)分別表示標簽li和標簽lj的權重值;SN(li)表示指向標簽節點li的節點的集合;w(li,lj)表示標簽li和lj之間的相關性;d表示阻尼系數;每個節點均具有一個初始權重,該初始權重設置為1/m,其中m為節點的總數,即標簽的總數;
步驟S3、定義模型中第i個特征到達的時刻為ti,并初始化ti=0,特征隨著時間的推移依次流入模型;
步驟S4、定義在時刻ti到達的特征為fi;定義特征數的極限值為INF;定義候選特征集為CFS,并初始化定義相關性閾值為δ;
步驟S5、對i與INF的值進行比較,判斷i≤INF是否成立;若成立,則執行步驟S6-S12;若不成立,結束所有步驟并退出;
步驟S6、判斷步驟S4定義的候選特征集CFS是否為空集;若候選特征集CFS為空集,則進入步驟S7;若候選特征集CFS不為空集,則進入步驟S8;
步驟S7、當新流入一個特征fi時,判斷新流入的特征fi與標簽集L是否相關,對新流入的特征fi與標簽集L進行相關性分析,若兩者不相關,則刪除該新流入的特征fi,并進入步驟S12;若兩者相關,則將該新流入的特征fi加入到候選特征集CFSi-1,此時,候選特征集CFS=CFSi-1∪fi,之后進入步驟S12;
步驟S8、當新流入一個特征fi時,對特征fi進行顯著性分析,判斷特征fi是否為顯著特征;若該新流入的特征fi為顯著特征,則將該新流入的特征fi加入到候選特征集CFSi-1,此時,候選特征集CFS=CFSi-1∪fi;若該新流入的特征fi為非顯著特征,則進入步驟S9;
步驟S9、判斷該新流入的特征fi與標簽集L是否相關,對該新流入的特征fi與標簽集L進行相關性分析;若兩者不相關,則刪除fi并進入步驟S12;若兩者相關,則進入步驟S10;
步驟S10、遍歷候選特征集CFSi-1中的每個特征,判斷CFSi-1中是否存在特征fk能代替該新流入的特征fi,若存在能代替特征fi的特征fk,則將該新流入的特征fi作為冗余特征刪除并進入步驟S12;否則,進入步驟S11;
步驟S11、遍歷候選特征集CFSi-1中的每個特征,判斷該新流入特征fi能否代替CFSi-1中的某個特征fk,若CFSi-1中存在能夠被新流入的特征fi代替的特征fk,則將該特征fk作為冗余特征從候選特征集CFSi-1中刪除,CFSi-1=CFSi-1-fk,并將新流入的特征fi加入到候選特征集CFSi-1,此時,候選特征集CFS=CFSi-1∪fi,之后進入步驟S12;否則,直接將新流入的特征fi加入到候選特征集CFSi-1,候選特征集CFS=CFSi-1∪fi,之后進入步驟S12;
步驟S12、判斷是否有特征未處理;若結果為是,則返回步驟S5按照流程重新進行操作;若結果為否,則輸出最優特征子集SF=CFS。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于燕山大學,未經燕山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110680679.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種自密實型瀝青混合料
- 下一篇:屏幕測試治具、方法和裝置





