[發明專利]一種基于深度學習的服飾解析方法、設備及存儲介質在審
| 申請號: | 202011437792.0 | 申請日: | 2020-12-10 |
| 公開(公告)號: | CN112560637A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 桂彥;熊達銘 | 申請(專利權)人: | 長沙理工大學 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/34;G06K9/46;G06K9/62;G06N20/00 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 鄧建輝 |
| 地址: | 410000 湖南省*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 深度 學習 服飾 解析 方法 設備 存儲 介質 | ||
1.一種基于深度學習的服飾解析方法,其特征在于,包括以下步驟:
獲取用于訓練的原始圖像,通過姿態估計器從所述原始圖像中采集與每一人體部位對應的若干候選關鍵點,并通過隨機采樣策略從若干候選關鍵點中選取出與每一所述人體部位相對應的一個關鍵點;
隨機采集背景點,將所述關鍵點和所述背景點轉換成對應的距離圖;
將所述原始圖像和所有所述距離圖輸入至預設的區域級分割模型中進行訓練;所述區域級分割模型包括一個區域級分割網絡,所述區域級分割網絡包括五個池化層,所述區域級分割網絡的輸出先上采樣與第四個池化層的輸出融合,再上采樣與第三個池化層的輸出融合,最后上采樣得到概率圖,所述區域級分割網絡采用二分類交叉熵作為損失函數;
通過訓練完成的所述區域級分割模型對待解析圖像進行處理,得到輸出的服飾解析結果。
2.根據權利要求1所述的基于深度學習的服飾解析方法,其特征在于,還包括對所述區域級分割網絡的輸出結果進行優化處理,所述優化處理過程如下:
E(L)=λ·R(L)+B(L)
其中E(L)表示能量函數,R(L)表示數據項,B(L)表示平滑項,λ表示指定R(L)和B(L)之間的相對重要性的系數,B(L)包含邊界屬性,表示像素p與標簽L之間的懲罰因子;
其中表示像素點pij的標簽,和分別表示像素點pij與像素點pmn的顏色值,σ表示超參。
3.根據權利要求2所述的基于深度學習的服飾解析方法,其特征在于,通過最大流量/最小切割法求解所述E(L)。
4.根據權利要求1所述的基于深度學習的服飾解析方法,其特征在于,所述區域級分割網絡的損失函數為:
其中St表示所述關鍵點所對應的所述人體部位,Sb表示背景區域,W表示網絡參數,yj表示像素j在圖中的標簽,β表示平衡權重,β=|Sb|/|St|;
采用adam自適應動量隨機優化所述損失函數。
5.根據權利要求3所述的基于深度學習的服飾解析方法,其特征在于,通過訓練完成的所述區域級分割模型對所述待解析圖像進行處理,包括步驟:
獲取待解析圖像,通過姿態估計器采集與每一人體部位相對應的關鍵點,為每一所述關鍵點生成對應的關鍵點圖像,所述關鍵點圖像與所述待解析圖像的尺寸相同;
隨機采集背景點,將所述關鍵點圖像和所述背景點圖像轉換成對應的距離圖;
將所述距離圖和所述待解析圖像依次迭代輸入至所述區域級分割網絡,并對所述區域級分割網絡的輸出結果進行優化處理;
得到所述待解析圖像的服飾解析結果。
6.根據權利要求1所述的基于深度學習的服飾解析方法,其特征在于,所述姿態估計器在數據集中的ground truth中采集關鍵點。
7.一種基于深度學習的服飾解析設備,其特征在于,包括:至少一個控制處理器和用于與所述至少一個控制處理器通信連接的存儲器;所述存儲器存儲有可被所述至少一個控制處理器執行的指令,所述指令被所述至少一個控制處理器執行,以使所述至少一個控制處理器能夠執行如權利要求1至6任一項所述的基于深度學習的服飾解析方法。
8.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有計算機可執行指令,所述計算機可執行指令用于使計算機執行如權利要求1至6任一項所述的基于深度學習的服飾解析方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于長沙理工大學,未經長沙理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011437792.0/1.html,轉載請聲明來源鉆瓜專利網。





