[發明專利]人臉圖像數據集的擴充方法和裝置在審
| 申請號: | 201911421810.3 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111160487A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 朱軍;周聿浩;石佳欣 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N20/00 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 張秀程 |
| 地址: | 100084 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 圖像 數據 擴充 方法 裝置 | ||
1.一種人臉圖像數據集的擴充方法,其特征在于,包括:
確定人臉圖像數據集和預計擴充圖像個數;
采用所述人臉圖像數據集中的圖像訓練變分自編碼器,確定所述變分自編碼器的參數,其中,所述變分自編碼器包括編碼器和解碼器;
將期望的圖像矢量描述的分布采集預計擴充圖像個數的圖像矢量描述輸入所述解碼器,得到預計擴充圖像個數的圖像;
其中,所述變分自編碼器的訓練過程中需要最小化的目標函數關于變分自編碼器的參數的梯度是通過樣本基于Stein等式和Nystrom算法得到的。
2.根據權利要求1所述的人臉圖像數據集的擴充方法,其特征在于,
所述編碼器的輸入為圖像數據,輸出為對應于每一幅輸入圖像的圖像矢量描述;
所述解碼器的輸入為圖像矢量描述,輸出為對應于每一個輸入圖像矢量描述的圖像。
3.根據權利要求2所述的人臉圖像數據集的擴充方法,其特征在于,采用所述人臉圖像數據集中的圖像訓練變分自編碼器,具體包括:
確定第一訓練次數以及每次訓練需要的第一圖像個數;
每次訓練中,采用第一圖像個數的圖像進行訓練,計算需要最小化的目標函數關于待優化的編碼器的參數的第一梯度,計算需要最小化的目標函數關于待優化的解碼器的參數的第二梯度;
基于所述第一梯度和所述第二梯度,利用隨機優化器更新所述編碼器的參數和所述解碼器的參數;
經過第一訓練次數的訓練后,確定所述編碼器的參數和所述解碼器的參數。
4.根據權利要求3所述的人臉圖像數據集的擴充方法,其特征在于,所述需要最小化的目標函數為:
Epx(x)Eq(z|x)[|x-G(z)|2]+λ·KL(q(z),p(z))
其中,z為編碼器輸出的圖像描述矢量,x為輸入的編碼器的圖像數據,p(z)為期望的圖像描述矢量的分布,q(z)為編碼器輸出的圖像描述矢量的分布,q(z|x)是編碼器決定的圖像描述矢量近似后驗分布,λ為正則化系數,KL(q(z),p(z))表示期望的圖像描述矢量的分布p(z)和編碼器輸出的圖像描述矢量的分布q(z)之間的Kullback-Leibler散度,G(z)表示解碼器的輸出圖像;
所述第一梯度為:
其中,φ是編碼器的參數,Gφ是通過反向傳播技術計算的函數關于φ的梯度,M是每次訓練中輸入的圖像的個數,xm是輸入編碼器的圖像數據,每次訓練輸入編碼器的圖像數據為x1,…,xM,ym是解碼器輸出的對應于xm的圖像數據,zm是編碼器輸出的對應于xm的圖像描述矢量,λ為正則化系數,q(zm)為期望的圖像描述矢量的分布,為利用標準反向傳播技術計算的梯度;
所述第二梯度為Gθ,θ是解碼器的參數,所述第二梯度是通過反向傳播技術計算的函數關于θ的梯度,M是每次訓練中輸入的圖像的個數,xm是輸入編碼器的圖像數據,每次訓練輸入編碼器的圖像數據為x1,…,xM,ym是解碼器輸出的對應于xm的圖像數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911421810.3/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





