[發(fā)明專利]特征分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202110394351.5 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113139447A | 公開(公告)日: | 2021-07-20 |
| 發(fā)明(設(shè)計(jì))人: | 李賜興;朱曉龍;許壯;紀(jì)曉龍;季興;湯善敏;張正生;劉永升 | 申請(專利權(quán))人: | 超參數(shù)科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06N3/08;G06N20/00;A63F13/53 |
| 代理公司: | 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 44224 | 代理人: | 唐彩琴 |
| 地址: | 518000 廣東省深圳市南山區(qū)粵海街道高*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 特征 分析 方法 裝置 計(jì)算機(jī) 設(shè)備 存儲 介質(zhì) | ||
本申請涉及一種特征分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。所述方法包括:獲取預(yù)設(shè)數(shù)據(jù)集;將所述預(yù)設(shè)數(shù)據(jù)集中各個(gè)預(yù)設(shè)數(shù)據(jù)的輸入特征輸入目標(biāo)機(jī)器學(xué)習(xí)模型中,得到各個(gè)所述預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出;基于各個(gè)所述預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出確定各個(gè)所述預(yù)設(shè)數(shù)據(jù)各自的輸入特征的特征敏感度;基于各個(gè)所述特征敏感度確定所述目標(biāo)機(jī)器學(xué)習(xí)模型對應(yīng)的待分析特征集合中各個(gè)待分析特征的平均敏感度,基于各個(gè)待分析特征的平均敏感度對各個(gè)待分析特征進(jìn)行排序,得到排序結(jié)果。采用本方法能夠提高特征排序準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請涉及計(jì)算機(jī)技術(shù)領(lǐng)域,特別是涉及一種特征分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
背景技術(shù)
隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)的人工智能(AI)走進(jìn)了大眾的視野。作為機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的方向,深度學(xué)習(xí)在搜索技術(shù)、數(shù)據(jù)挖掘、圖像識別、自然語言處理等方面取得的效果,遠(yuǎn)遠(yuǎn)超過先前相關(guān)技術(shù)。機(jī)器學(xué)習(xí)用于現(xiàn)實(shí)任務(wù)時(shí),描述樣本的特征通常需要由人類專家設(shè)計(jì),這被稱為“特征工程”。特征工程在機(jī)器學(xué)習(xí)中占據(jù)相當(dāng)重要的地位。
相關(guān)技術(shù)中,通常將機(jī)器學(xué)習(xí)模型初始層的網(wǎng)絡(luò)權(quán)重作為特征重要度的系數(shù),再根據(jù)權(quán)重,對輸入模型的特征進(jìn)行重要度排序并進(jìn)行特征篩選。由于多層神經(jīng)網(wǎng)絡(luò)本身具有將底層特征轉(zhuǎn)換成高維特征,并進(jìn)行特征選擇的功能,因此第一層網(wǎng)絡(luò)的權(quán)重可以視為模型本身對底層特征進(jìn)行篩選的系數(shù)。然而,由于機(jī)器學(xué)習(xí)模型具有整體性,僅選取第一層網(wǎng)絡(luò)的權(quán)重不能完整反應(yīng)特征對模型整體預(yù)測結(jié)果的貢獻(xiàn)度,因此排序得到的結(jié)果并不準(zhǔn)確。
發(fā)明內(nèi)容
基于此,有必要針對上述技術(shù)問題,提供一種能夠提高特征排序準(zhǔn)確性的特征分析方法、裝置、計(jì)算機(jī)設(shè)備和存儲介質(zhì)。
一種特征分析方法,所述方法包括:
獲取預(yù)設(shè)數(shù)據(jù)集;
將所述預(yù)設(shè)數(shù)據(jù)集中各個(gè)預(yù)設(shè)數(shù)據(jù)的輸入特征輸入目標(biāo)機(jī)器學(xué)習(xí)模型中,得到各個(gè)所述預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出;
基于各個(gè)所述預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出確定各個(gè)所述預(yù)設(shè)數(shù)據(jù)各自的輸入特征的特征敏感度;
基于各個(gè)所述特征敏感度確定所述目標(biāo)機(jī)器學(xué)習(xí)模型對應(yīng)的待分析特征集合中各個(gè)待分析特征的平均敏感度,基于各個(gè)待分析特征的平均敏感度對各個(gè)待分析特征進(jìn)行排序,得到排序結(jié)果。
在一些實(shí)施例中,所述預(yù)設(shè)數(shù)據(jù)集為游戲視頻幀組成的集合;所述預(yù)設(shè)數(shù)據(jù)的輸入特征包括第一輸入特征和第二輸入特征;所述基于各個(gè)所述預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出確定各個(gè)所述預(yù)設(shè)數(shù)據(jù)各自的輸入特征的特征敏感度,包括:
獲取目標(biāo)字段信息;
基于所述目標(biāo)字段信息解析各個(gè)所述游戲視頻幀,得到各個(gè)所述游戲視頻幀的第一輸入特征;
基于所述目標(biāo)字段信息及各個(gè)所述游戲視頻幀的第一輸入特征進(jìn)行計(jì)算,得到各個(gè)所述游戲視頻幀的第二輸入特征。
在一些實(shí)施例中,所述基于各個(gè)所述預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出確定各個(gè)所述預(yù)設(shè)數(shù)據(jù)各自的輸入特征的特征敏感度包括:
對于每一個(gè)輸入特征,基于所述輸入特征對應(yīng)的預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出對所述輸入特征的每一維計(jì)算偏導(dǎo)數(shù);
基于所述輸入特征對應(yīng)的各個(gè)偏導(dǎo)數(shù)計(jì)算所述輸入特征的范數(shù),將所述范數(shù)作為所述輸入特征的特征敏感度。
在一些實(shí)施例中,所述預(yù)設(shè)數(shù)據(jù)集中每一個(gè)預(yù)設(shè)數(shù)據(jù)存在對應(yīng)的期望輸出;所述基于所述輸入特征對應(yīng)的預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出對所述輸入特征的每一維計(jì)算偏導(dǎo)數(shù)包括:
基于所述輸入特征對應(yīng)的預(yù)設(shè)數(shù)據(jù)的預(yù)測輸出和期望輸出確定對應(yīng)的預(yù)測損失;
計(jì)算所述預(yù)測損失對所述輸入特征的每一維的一階偏導(dǎo)數(shù)。
在一些實(shí)施例中,所述方法還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于超參數(shù)科技(深圳)有限公司,未經(jīng)超參數(shù)科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110394351.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





