[發明專利]基于多任務與弱監督的美麗預測方法、裝置及存儲介質有效
| 申請號: | 202010587525.5 | 申請日: | 2020-06-24 |
| 公開(公告)號: | CN111832436B | 公開(公告)日: | 2023-06-16 |
| 發明(設計)人: | 甘俊英;白振峰;翟懿奎;何國輝 | 申請(專利權)人: | 五邑大學 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 孫浩 |
| 地址: | 529000 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 任務 監督 美麗 預測 方法 裝置 存儲 介質 | ||
1.基于多任務與弱監督的美麗預測方法,其特征在于,包括以下步驟:
預處理輸入的人臉圖像得到預處理圖像,其中所述預處理圖像包括標有真值標簽的真值圖像和標有噪聲標簽的噪聲圖像;
將所述預處理圖像分配至多個任務,其中每個所述任務包含多個所述真值圖像和多個所述噪聲圖像,多個所述任務包括一個具體為人臉美麗預測的主任務和多個與人臉美麗預測相關的輔任務;通過特征提取層處理多個所述任務的所述真值圖像和所述噪聲圖像得到共享的圖像特征;
通過多個由殘差網、標準神經網絡和分類器組成的分類網絡處理所述圖像特征得到多個分類結果,其中多個所述分類網絡與多個所述任務一一對應;
其中,在分類網絡中,通過所述殘差網處理所述圖像特征,學習從所述圖像特征到所述真值標簽與所述噪聲標簽的殘差值的映射,并得到第一預測值;通過所述標準神經網絡,學習從所述圖像特征到所述真值標簽的映射,并得到第二預測值;通過分類器根據所述第一預測值和所述第二預測值得到所述分類結果;
所述殘差網的損失函數為:
其中Dn是所述圖像特征,yi是所述噪聲標簽,hi是所述第一預測值,Lnoise是所述殘差網的損失值,Nn是所述圖像特征的總數量;所述標準神經網絡的損失函數為:
其中vj是所述真值標簽,gj是所述第二預測值,Lclean是所述標準神經網絡的損失值;
多個所述分類網絡的總體目標為:
,其中W是超參數,α是所述殘差網的損失值與所述標準神經網絡的損失值之間的權衡參數。
2.根據權利要求1所述的基于多任務與弱監督的美麗預測方法,其特征在于,所述預處理輸入的人臉圖像得到預處理圖像具體是:對所述人臉圖像依次進行圖像增強處理、圖像矯正處理、圖像裁剪處理、圖像去重處理和圖像歸一化處理得到預處理圖像。
3.根據權利要求1所述的基于多任務與弱監督的美麗預測方法,其特征在于,所述特征提取層是VGG16、ResNet50、Google?InceptionV3或DenseNet中的一種。
4.根據權利要求1所述的基于多任務與弱監督的美麗預測方法,其特征在于,多個所述任務的總體損失函數為:
其中L是單個所述任務的損失,ω是對n?n應每個所述任務的權重。
5.根據權利要求1所述的基于多任務與弱監督的美麗預測方法,其特征在于,在每個所述任務中,所述噪聲圖像的數量比所述真值圖像的數量多。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于五邑大學,未經五邑大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010587525.5/1.html,轉載請聲明來源鉆瓜專利網。





