[發明專利]一種電商產品圖片目錄構建方法在審
| 申請號: | 202211248142.0 | 申請日: | 2022-10-12 |
| 公開(公告)號: | CN115511571A | 公開(公告)日: | 2022-12-23 |
| 發明(設計)人: | 呂晨;肖萬松;房鵬展 | 申請(專利權)人: | 焦點科技股份有限公司 |
| 主分類號: | G06Q30/06 | 分類號: | G06Q30/06;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京瑞弘專利商標事務所(普通合伙) 32249 | 代理人: | 陳建和 |
| 地址: | 210032 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 產品圖片 目錄 構建 方法 | ||
1.一種電商產品圖片目錄構建方法,其特征在于,包括以下步驟:
步驟1:設計一種基于深度卷積神經網絡模型的圖片特征編碼器,引用構建的訓練數據集,所述訓練數據集的訓練方法采用度量學習方法,利用編碼器提取訓練數據集中的圖片特征,所述圖片特征編碼器采用殘差結構,在原始主干網絡基礎上,接一個全連接層,輸出256維向量作為圖片特征;
步驟2:構建圖片特征聚類模塊,使用k-means聚類算法進行聚類;使用余弦相似度作為圖片特征的距離度量函數,初始的聚類數量值為電商三級目錄產品數;同時聚類前,對步驟1輸出的256維圖片特征進行L2正則化使其模為1,使用聚類結果更新樣本標簽;
步驟3:構建聚類拆分融合模塊,遍歷步驟2得到的聚類結果,對結果進行拆分與融合,遍歷結束后,得到新的聚類結果,同時更新步驟2的聚類數量值與步驟1中的樣本標簽;
步驟4:構建電商商品圖片外觀目錄,待到步驟3無可拆分與融合的聚類結果時,方案迭代結束;每個聚類結果作為一個電商商品圖片目錄,簇心向量作為該目錄的錨點向量,判斷增量圖片的歸屬,同簇樣本作為該目錄的圖片,所述步驟1的圖片特征編碼器用于提取增量圖片外觀特征,計算提取到的特征和目錄錨點向量的余弦相似度,歸屬到相似度最大的目錄中,相似度計算公式為:
其中,A,B分別為圖片提取的特征向量與目錄錨點向量。
2.根據權利要求1所述的一種電商產品圖片目錄構建方法,其特征在于,所述編碼器為一種圖片特征編碼器,步驟1具體包括:
步驟1.1:圖片特征編碼器的選取與修改,選取ResNet101作為圖片特征編碼器的backbone,所述ResNet101采用5次下采樣,用以將圖片最終匯聚成2048*7*7的featuremap,利用avg_pooling得到2048維特征,在原始的ResNet101網絡結構基礎上,增加一個全連接層,輸出256維圖片特征向量,同時將第一個stage使用conv下采樣,將stride設置為2,采用pre_padding的方式;
步驟1.2:度量學習編碼器的損失函數設置,所述損失函數采用Triplet loss損失:輸入由三元組組成,每個三元組包含一個query、一個與query屬于同一類的正樣本、一個與query屬于不同類的負樣本,Tripletloss要求query到負樣本的距離與query到正樣本的距離之差要大于預設值m;
步驟1.3:樣本數據集的構建,從傳統商品目錄中每個三級目錄選取一張圖片作為錨點,同目錄選取500-1000張圖片作為一類,構建初始標簽。
3.根據權利要求2所述的一種電商產品圖片目錄構建方法,其特征在于,步驟2具體包括:
步驟2.1:使用度量學習編碼器對圖片特征進行L2正則化;
步驟2.2:使用圖片特征聚類模塊自適應更新樣本標簽;使用聚類結果中離簇心最近的樣本作為該簇錨點,該簇樣本作為同類標簽,更新樣本數據集標簽。
4.根據權利要求3所述的一種基于度量學習與聚類自標簽學習的電商商品外觀圖片目錄搭建方法,其特征在于,步驟3具體包括:
步驟3.1:判斷聚類結果是否可以拆分或融合,若不能拆分融合,進入步驟4,否則繼續;
步驟3.2:聚類結果拆分,遍歷步驟2得到的聚類結果,計算簇內樣本距離簇心的平均距離dave,對平均距離dave滿足拆分閾值Ps的,使用該簇樣本作為新的數據進行聚類,設置聚類模塊值為2,得到基于該簇的新的兩個簇;
步驟3.3:聚類結果融合,遍歷步驟2得到的聚類結果,計算簇間簇心的距離dc,對簇心距離dc滿足融合閾值Pm的兩個簇,使用兩簇樣本作為新的數據進行聚類,設置聚類模塊值為1,得到基于該簇的新的一個簇;
步驟3.4:更新參數,經過步驟3.1和步驟3.2之后得到最新的聚類結果,使用現在的簇數量更新步驟2的聚類數量值,使用每簇離簇心最近的樣本作為錨點,同簇樣本作為同類標簽,更新步驟1中的樣本標簽,重新訓練步驟1的圖片特征編碼器。
5.根據權利要求4所述的一種電商產品圖片目錄構建方法,其特征在于,所述步驟1.2中,所述預設值m的取值為0.5。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于焦點科技股份有限公司,未經焦點科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211248142.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電動汽車堵轉熱管理系統及方法
- 下一篇:一種運動評估輔助機器人系統





