[發明專利]商品屬性生成模型的訓練方法及生成、搜索方法和系統在審
| 申請號: | 201811159166.2 | 申請日: | 2018-09-30 |
| 公開(公告)號: | CN110968775A | 公開(公告)日: | 2020-04-07 |
| 發明(設計)人: | 湯海萍;陳海勇 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06F40/284;G06N20/00;G06Q30/06 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 薛琦;羅朗 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 商品 屬性 生成 模型 訓練 方法 搜索 系統 | ||
1.一種商品屬性生成模型的訓練方法,其特征在于,所述訓練方法包括:
獲取多個商品的商品信息,所述商品信息包括文本和圖片;
標注所述多個商品的屬性信息,所述屬性信息包括至少一個屬性分詞;
構造多組訓練數據,每組訓練數據包括同一商品的商品信息和屬性信息;
根據所述多組訓練數據訓練所述商品屬性生成模型,所述商品屬性生成模型用于根據商品信息生成屬性信息。
2.如權利要求1所述的商品屬性生成模型的訓練方法,其特征在于,所述根據所述多組訓練數據訓練商品屬性生成模型的步驟包括:
利用編碼-解碼模型框架訓練所述多組訓練數據。
3.如權利要求2所述的商品屬性生成模型的訓練方法,其特征在于,所述利用編碼-解碼模型框架訓練所述多組訓練數據的步驟包括:
對于每組訓練數據,對文本進行分詞,得到分詞序列;
將所述分詞序列轉換成分詞向量;
對所述分詞向量進行編碼,得到編碼向量;
提取圖片的特征向量;
根據所述編碼向量和所述特征向量進行解碼,得到屬性信息。
4.如權利要求3所述的商品屬性生成模型的訓練方法,其特征在于,在所述根據所述編碼向量和所述特征向量進行解碼的步驟之前,所述訓練方法還包括:
將所述編碼向量和所述特征向量輸入注意力模型;
計算當前時刻所述編碼向量和所述特征向量的注意力分布值;
所述根據所述編碼向量和所述特征向量進行解碼的步驟具體包括:
根據當前時刻的注意力分布值以及上一時刻得到的解碼分詞進行解碼,得到當前時刻的解碼分詞;
其中,所述解碼分詞為屬性分詞。
5.如權利要求3所述的商品屬性生成模型的訓練方法,其特征在于,所述將所述分詞序列轉換成分詞向量的步驟包括:
利用word2vec模型將所述分詞序列轉換成分詞向量;
所述提取圖片的特征向量的步驟包括:
利用resnet模型提取圖片的特征向量。
6.如權利要求5所述的商品屬性生成模型的訓練方法,其特征在于,所述利用word2vec模型將所述分詞序列轉換成分詞向量的步驟包括:
利用外部數據預先訓練所述word2vec模型;
所述利用resnet模型提取圖片的特征向量的步驟包括:
利用imagenet數據預先訓練所述resnet模型。
7.如權利要求1所述的商品屬性生成模型的訓練方法,其特征在于,所述多個商品包括:
商品信息中的文本與標注的屬性信息相似度高于第一閾值的商品;
和/或,根據搜索詞進行商品搜索,返回的搜索結果中點擊率高于第二閾值的商品。
8.一種電子設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1-7中任一項所述的商品屬性生成模型的訓練方法。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-7中任一項所述的商品屬性生成模型的訓練方法的步驟。
10.一種商品屬性的生成方法,其特征在于,所述生成方法包括:
利用如權利要求1-7中任一項所述的商品屬性生成模型的訓練方法訓練商品屬性生成模型;
獲取商品的商品信息,所述商品信息包括文本和圖片;
將所述商品信息輸入所述商品屬性生成模型;
輸出所述商品的屬性信息。
11.如權利要求10所述的商品屬性的生成方法,其特征在于,所述屬性信息包括至少一個屬性分詞,所述輸出屬性信息的步驟包括:
選擇預設數量的屬性分詞;
輸出經選擇的所述預設數量的屬性分詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811159166.2/1.html,轉載請聲明來源鉆瓜專利網。





