[發明專利]深度學習任務處理方法、圖像識別任務處理方法和裝置在審
| 申請號: | 202010155364.2 | 申請日: | 2020-03-07 |
| 公開(公告)號: | CN111382791A | 公開(公告)日: | 2020-07-07 |
| 發明(設計)人: | 朱禹軻;柏炎 | 申請(專利權)人: | 北京邁格威科技有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 何少巖 |
| 地址: | 100000 北京市海淀區科*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 深度 學習 任務 處理 方法 圖像 識別 裝置 | ||
本發明提供了一種深度學習任務處理方法、圖像識別任務處理方法和裝置;其中,該深度學習任務處理方法包括:獲取待處理對象,將待處理對象輸入至預先訓練完成的網絡模型中,輸出待處理對象對應的特征數據;基于特征數據,完成預設的深度學習任務;其中,網絡模型根據第一樣本特征和第二樣本特征訓練得到;預設的訓練樣本輸入至網絡模型后,網絡模型輸出第一樣本特征;第一樣本特征經預設的映射矩陣映射后,得到第二樣本特征;映射矩陣根據第一樣本特征對應的訓練樣本的類別標簽和預設的目標類別確定。該方式可以在特征歸一化的情況下,實現在特征層面的數據增強。
技術領域
本發明涉及深度學習技術領域,尤其是涉及一種深度學習任務處理方法、圖像識別任務處理方法和裝置。
背景技術
數據增強可以有效增加深度學習網絡的訓練數據的多樣性。常用的數據增強方式中,通常在源數據層面進行增強,例如對訓練圖像進行隨機的旋轉、平移、縮放等;但是這些方式通常都需要人工設計,導致增強后的數據種類有限。另一種方式中,可以在網絡輸出的特征層面進行增強,但是現有的在特征層面進行增強的方式,難以適用于特征歸一化的情況,不利于從整體上提高網絡訓練的精確度。
發明內容
有鑒于此,本發明的目的在于提供一種深度學習任務處理方法、圖像識別任務處理方法和裝置,以在特征歸一化的情況下,實現在特征層面的數據增強。
第一方面,本發明實施例提供了一種深度學習任務處理方法,方法包括:獲取待處理對象,將待處理對象輸入至預先訓練完成的網絡模型中,輸出待處理對象對應的特征數據;基于特征數據,完成預設的深度學習任務;其中,網絡模型根據第一樣本特征和第二樣本特征訓練得到;預設的訓練樣本輸入至網絡模型后,網絡模型輸出第一樣本特征;第一樣本特征經預設的映射矩陣映射后,得到第二樣本特征;映射矩陣根據第一樣本特征對應的訓練樣本的類別標簽和預設的目標類別確定。
進一步地,上述網絡模型具體通過下述方式訓練得到:將預設的多個訓練樣本輸入至網絡模型中,輸出每個訓練樣本對應的第一樣本特征;其中,每個訓練樣本攜帶有該訓練樣本的類別標簽;針對每個訓練樣本,從預設的備選類別中確定目標類別;根據目標類別和該訓練樣本的類別標簽,確定映射矩陣;根據映射矩陣和該訓練樣本對應的第一樣本特征,確定該訓練樣本的第二樣本特征;根據每個訓練樣本的第一樣本特征和第二樣本特征,確定損失值,根據損失值訓練網絡模型。
進一步地,上述根據目標類別和該訓練樣本的類別標簽,確定映射矩陣的步驟,包括:映射矩陣其中,A為映射矩陣;I為預設的單位矩陣;ni=μi;μi為該訓練樣本的類別標簽的特征向量幾何中心;為ni的轉置;μj為目標類別的特征向量幾何中心;為μj的轉置;‖‖2代表二次范數;α為該訓練樣本的類別標簽的特征向量幾何中心與目標類別的特征向量幾何中心之間的旋轉角;
進一步地,上述根據映射矩陣和該訓練樣本對應的第一樣本特征,確定該訓練樣本的第二樣本特征的步驟,包括:該訓練樣本的第二樣本特征其中,為該訓練樣本的第二樣本特征;xi為該訓練樣本對應的第一樣本特征;A為映射矩陣。
進一步地,上述根據每個訓練樣本的第一樣本特征和第二樣本特征,確定損失值的步驟,包括:損失值loss=L(X,Y)+λL(Xgen,Ygen);其中,loss為損失值;L()為預設的損失函數;X為每個訓練樣本的第一樣本特征,Y為每個訓練樣本的類別標簽;λ為預設的權重系數;Xgen為每個訓練樣本的第二樣本特征;Ygen為每個訓練樣本對應的目標類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京邁格威科技有限公司,未經北京邁格威科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010155364.2/2.html,轉載請聲明來源鉆瓜專利網。





