[發(fā)明專利]一種基于對抗訓(xùn)練的自監(jiān)督行為識別方法及系統(tǒng)在審
| 申請?zhí)枺?/td> | 202210340188.9 | 申請日: | 2022-04-01 |
| 公開(公告)號: | CN114821398A | 公開(公告)日: | 2022-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 胡建國;黎昱彤;張?jiān)?/a>;楊學(xué)彬;盧星宇;吳勁 | 申請(專利權(quán))人: | 中山大學(xué);中山大學(xué)深圳研究院 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06N20/00 |
| 代理公司: | 廣東廣盈專利商標(biāo)事務(wù)所(普通合伙) 44339 | 代理人: | 李俊 |
| 地址: | 510275 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 對抗 訓(xùn)練 監(jiān)督 行為 識別 方法 系統(tǒng) | ||
1.一種基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述基于對抗訓(xùn)練的自監(jiān)督行為識別方法包括:
抽取視頻數(shù)據(jù),輸入標(biāo)準(zhǔn)化流模型;
對視頻數(shù)據(jù)進(jìn)行攻擊處理,得到對抗視頻;
計(jì)算視頻數(shù)據(jù)以及對抗視頻在學(xué)習(xí)模式下的對抗損失;
基于對抗損失更新標(biāo)準(zhǔn)化流模型的期望值參數(shù),并判斷是否完成更新;
若是,則基于標(biāo)準(zhǔn)化流模型配合期待值參數(shù)生成對抗樣本;
將對抗樣本輸入對比學(xué)習(xí)中。
2.根據(jù)權(quán)利要求1所述的基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述抽取視頻數(shù)據(jù),包括:
抽取一個(gè)batch的視頻數(shù)據(jù),記為xi,將視頻數(shù)據(jù)輸入至標(biāo)準(zhǔn)化流模型,并設(shè)定更新數(shù)學(xué)期望值參數(shù)次數(shù)。
3.根據(jù)權(quán)利要求1所述的基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述對視頻數(shù)據(jù)進(jìn)行攻擊處理,包括:
在視頻數(shù)據(jù)中隨機(jī)提取一幀,通過標(biāo)準(zhǔn)化流模型生成像素,加入到整個(gè)視頻的每一幀,得到對抗視頻。
4.根據(jù)權(quán)利要求1所述的基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述計(jì)算視頻數(shù)據(jù)以及對抗樣本在學(xué)習(xí)模式下的對抗損失,包括:
對抗損失的計(jì)算公式為:
L(x’)=max(0,logC(x’)y-maxlogC(x’)c),c≠y
其中x’表示收到了對抗攻擊的輸入樣本,C()代表分類器,logC(x’)y表示分類器對于第y項(xiàng)即正確項(xiàng)的輸出得分,maxlogC(x’)c表示在所有的類的得分中最大的一個(gè)。
5.根據(jù)權(quán)利要求1所述的基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述基于對抗損失更新標(biāo)準(zhǔn)化流模型的期望值參數(shù),包括:
利用自然選擇策略反復(fù)更新期望值參數(shù);
根據(jù)懶人定理在此場景此下自然選擇策略的損失函數(shù)公式表示為:
式中,J(μ,σ)代表在自然選擇策略中的損失,projs代表為了符合對抗攻擊不可見性的要求,把生成的對抗樣本投影的相應(yīng)的空間中;本公式右邊的部分代表當(dāng)z向量服從z~N(z|μ,σ2I)分布的條件下,k個(gè)z向量在輸入標(biāo)準(zhǔn)化流模型f()后,在加上projs的限制生成的對抗樣本,在分類器中得到的k的損失L的數(shù)學(xué)期望;
對以上公式使用最大似然估計(jì)法,可以求出J(μ,σ)的雅各比行列式:
式中,為J(μ,σ)的雅各比行列式,I為單位矩陣,μ為期望值參數(shù),σ為超參數(shù);
接下來,通過以下公式更新期望值參數(shù)μ:
式中,α是一個(gè)經(jīng)驗(yàn)系數(shù),I為單位矩陣,μ為期望值參數(shù),σ為超參數(shù)。
6.根據(jù)權(quán)利要求4所述的基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述判斷是否完成更新,包括:
根據(jù)對抗損失以及預(yù)設(shè)的更新數(shù)學(xué)期望值參數(shù)次數(shù)判斷是否完成對期望值參數(shù)更新;
若對抗損失L(x’)=0時(shí),則判斷數(shù)學(xué)期望值參數(shù)μ完成更新,進(jìn)行下一步驟;
若對抗損失L(x’)≠0,且未達(dá)到預(yù)設(shè)數(shù)學(xué)期望值參數(shù)次數(shù)時(shí),則判斷未完成數(shù)學(xué)期望值參數(shù)μ的更新,重新對視頻數(shù)據(jù)進(jìn)行攻擊處理;
若對抗損失L(x’)≠0,且達(dá)到數(shù)學(xué)期望值參數(shù)次數(shù)時(shí),則判斷為數(shù)學(xué)期望值參數(shù)μ完成更新,進(jìn)行下一步驟。
7.根據(jù)權(quán)利要求5所述的基于對抗訓(xùn)練的自監(jiān)督行為識別方法,其特征在于,所述基于標(biāo)準(zhǔn)化流模型配合期待值參數(shù)生成對抗樣本,包括:
在生成對抗樣本的過程中,利用標(biāo)準(zhǔn)化流模型,從隨機(jī)向量z中生成對抗樣本x’,其中隨機(jī)向量z服從z~N(z|μ,σ2I),對抗樣本公式為:
x’=(projs(f(z)),z~N(z|μ,σ2I)。
式中,I為單位矩陣,μ為期望值參數(shù),σ為超參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué);中山大學(xué)深圳研究院,未經(jīng)中山大學(xué);中山大學(xué)深圳研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210340188.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種氟化鎂廢渣提純制備氟化鎂的方法
- 下一篇:固態(tài)電力接觸器
- 農(nóng)業(yè)信息對抗資源目標(biāo)規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源模糊規(guī)劃最優(yōu)分配方法
- 農(nóng)業(yè)信息對抗資源線性規(guī)劃最優(yōu)分配方法
- 基于聚類數(shù)據(jù)挖掘的對抗行為搜索算法
- 面向多種對抗圖片攻擊的協(xié)同免疫防御方法
- 一種自適應(yīng)對抗強(qiáng)度的對抗訓(xùn)練方法
- 對抗攻擊模型的訓(xùn)練方法及裝置
- 對抗樣本的生成方法和裝置
- 多樣本對抗擾動生成方法、裝置、存儲介質(zhì)和計(jì)算設(shè)備
- 一種無人集群協(xié)同博弈對抗的控制方法及系統(tǒng)
- 在即時(shí)通信中提供即時(shí)監(jiān)督功能的方法及系統(tǒng)
- 一種監(jiān)督事件的生成裝置
- 一種資產(chǎn)托管監(jiān)督任務(wù)的處理方法及裝置
- 一種監(jiān)督方法及裝置
- 基于自監(jiān)督學(xué)習(xí)的標(biāo)簽比例學(xué)習(xí)模型的訓(xùn)練方法和設(shè)備
- 一種衛(wèi)生監(jiān)督對象尋址方法、電子設(shè)備及存儲介質(zhì)
- 一種機(jī)器人表情調(diào)用方法和家用機(jī)器人
- 計(jì)算機(jī)視覺訓(xùn)練系統(tǒng)和用于訓(xùn)練計(jì)算機(jī)視覺系統(tǒng)的方法
- 一種基于廠區(qū)智能管理系統(tǒng)的工廠設(shè)備監(jiān)督系統(tǒng)
- 信息化綜合監(jiān)督系統(tǒng)及方法





