[發明專利]人臉解析模型的訓練方法、電子設備和存儲介質有效
| 申請號: | 202111487041.4 | 申請日: | 2021-12-07 |
| 公開(公告)號: | CN114267062B | 公開(公告)日: | 2022-12-16 |
| 發明(設計)人: | 季棟;曹天宇;李緒琴;陳智超;戶磊 | 申請(專利權)人: | 合肥的盧深視科技有限公司 |
| 主分類號: | G06V40/16 | 分類號: | G06V40/16;G06V10/774;G06N3/04;G06N3/08 |
| 代理公司: | 北京智晨知識產權代理有限公司 11584 | 代理人: | 張婧 |
| 地址: | 230091 安徽省合肥市高新區習友路3333*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 解析 模型 訓練 方法 電子設備 存儲 介質 | ||
本申請實施例涉及計算機視覺技術領域,公開了一種人臉解析模型的訓練方法、電子設備和計算機可讀存儲介質,該方法包括:構建第一模型,第一模型包括用于進行池化和下采樣處理的第一模塊,以及用于進行擴大感受野和上采樣處理的第二模塊;根據第一訓練樣本對第一模型進行第一訓練,得到完成第一訓練的第一模型;根據第二訓練樣本和預訓練的第二模型對完成第一訓練的第一模型進行第二訓練,得到完成第二訓練的第一模型,第二模型包括由堆疊的卷積和跳躍連接組成的編碼器,以及由堆疊的轉置卷積和空洞卷積組成的解碼器,訓練出的第一模型的參數較少,推理速度很快,可以部署在移動終端上,并且能夠在大幅減少計算量的同時保持高性能。
技術領域
本申請實施例涉及計算機視覺技術領域,特別涉及一種人臉解析模型的訓練方法、電子設備和存儲介質。
背景技術
隨著計算機視覺和神經網絡技術的飛速發展,以人類本身為核心的研究方向層出不窮,其中,針對人臉圖像相關內容的研究最為廣泛,比如人臉識別、人臉屬性分析、人臉關鍵點檢測和人臉解析等,人臉解析技術旨在通過各種算法將人臉的各子區域區分開,根據實際情況的具體需求的不同,人臉解析技術在一般情況下可以將人臉解析出嘴唇、臉頰、頭發、眼睛、鼻子等子區域,該技術可以為下游產業的應用,比如人臉老齡化研究、虛擬換妝、表情識別等技術提供先驗知識。
人臉解析技術可以基于部署好的預先訓練的人臉解析模型實現,人臉解析模型的整體網絡可以是對稱結構,輸入圖像先經過卷積和下采樣處理來提取特征,然后再經過卷積和上采樣處理來擴大分辨率,其中,對稱結構中對稱的子模塊之間可以添加跳躍連接結構進行特征復用,模型最后的輸出為原始分辨率的輸出。
然而,由于人臉解析技術的本質是逐像素的分類問題,因此在神經網絡的算法設計上,也就是人臉解析模型需要使用全圖輸入、全圖輸出的處理,這導致模型的計算量過大,無法部署到計算能力較弱的移動終端上去。
發明內容
本申請實施例的目的在于提供一種模型訓練方法、電子設備和計算機可讀存儲介質,模型參數較少,推理速度很快,可以部署在移動終端上,并且能夠在大幅減少計算量的同時保持高精度的人臉解析。
為解決上述技術問題,本申請的實施例提供了一種人臉解析模型的訓練方法,包括以下步驟:構建第一模型;其中,所述第一模型包括第一模塊和第二模塊,所述第一模塊用于進行池化和下采樣處理,所述第二模塊用于進行擴大感受野和上采樣處理;根據第一訓練樣本對所述第一模型進行第一訓練,得到完成第一訓練的所述第一模型;根據第二訓練樣本和預訓練的第二模型對完成第一訓練的所述第一模型進行第二訓練,得到完成第二訓練的所述第一模型;其中,所述第二模型包括編碼器和解碼器,所述編碼器由堆疊的卷積和跳躍連接組成,所述解碼器由堆疊的轉置卷積和空洞卷積組成。
本申請的實施例還提供了一種電子設備,包括:至少一個處理器;以及,與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述的人臉解析模型的訓練方法。
本申請的實施例還提供了一種計算機可讀存儲介質,存儲有計算機程序,所述計算機程序被處理器執行時實現上述的人臉解析模型的訓練方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于合肥的盧深視科技有限公司,未經合肥的盧深視科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111487041.4/2.html,轉載請聲明來源鉆瓜專利網。





