[發明專利]確定商品屬性的方法、裝置、設備和存儲介質在審
| 申請號: | 201810175616.0 | 申請日: | 2018-03-02 |
| 公開(公告)號: | CN110223095A | 公開(公告)日: | 2019-09-10 |
| 發明(設計)人: | 徐揚 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F17/27 |
| 代理公司: | 北京東方億思知識產權代理有限責任公司 11258 | 代理人: | 彭瓊 |
| 地址: | 開曼群島*** | 國省代碼: | 開曼群島;KY |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 商品屬性 向量化 存儲介質 準確率 分詞 輸出 | ||
本發明實施例公開了一種確定商品屬性的方法、裝置、設備和存儲介質,其特征在于,包括:獲取商品標題;對所述商品標題進行分字分詞;向量化所述分字分字后的商品標題得到向量化的商品標題;將所述向量化的商品標題輸入商品屬性模型中,輸出所述商品標題對應的商品屬性。采用本發明實施例后,確定商品屬性的準確率較高。
技術領域
本發明涉及計算機領域,尤其涉及一種確定商品屬性的方法、裝置、設備和計算機可讀存儲介質。
背景技術
目前電商平臺確定商品屬性主要有以下兩種方式。一種方式是商品發布時,商家自行填寫商品屬性。另一個方式是通過商品交易信息,物流信息和商品標題文本等信息間接確定商品屬性。
絕大多數商品屬性是商家自行填寫的,然而也會存在商家誤填的情況和商家故意錯填的情況。尤其故意錯填商品屬性的商家,往往是惡意商家,會對消費者權益造成侵害。其次,通過商品交易信息、物流信息和商品標題文本等信息間接確定商品屬性的準確率較低。
綜上,現有技術中存在以下技術問題:確定商品屬性的準確率較低。
發明內容
本發明實施例提供了一種確定商品屬性的方法、裝置、設備和存儲介質,確定商品屬性的準確率校高。
一種確定商品屬性的方法,包括:
獲取商品標題;
對所述商品標題進行分字分詞;
向量化所述分字分字后的商品標題得到向量化的商品標題;
將所述向量化的商品標題輸入商品屬性模型中,輸出所述商品標題對應的商品屬性。
所述對所述商品標題進行分字分詞,包括:
結合高頻詞匯對所述商品標題進行分字分詞。
所述結合高頻詞匯對所述商品標題進行分字分詞,包括:
結合高頻詞匯對所述商品標題進行分詞,然后將所述商品標題中除高頻詞匯以外字符進行分字。
所述結合高頻詞匯對所述商品標題進行分字分詞之前,還包括:
對訓練樣本中的商品標題進行分詞得到分詞結果;
統計分詞結果,獲得所述高頻詞匯。
所述獲得所述高頻詞匯之后,還包括:
在所述高頻詞匯中添加專業詞匯,以更新所述高頻詞匯。
所述向量化所述分字分字后的商品標題得到向量化的商品標題,包括:
利用字向量表和詞向量表,向量化所述分字分字后的商品標題得到向量化的商品標題。
所述字向量表是利用高頻詞匯分割后的訓練樣本中的商品標題訓練字向量后得到的向量表;
所述詞向量表是利用高頻詞匯分割后的訓練樣本中的商品標題訓練詞向量后得到的向量表。
所述字向量表是利用Skip-Gram模型或CBOW模型訓練字向量得到的向量表;
所述詞向量表是利用Skip-Gram模型或CBOW模型訓練詞向量得到的向量表。
所述將所述向量化的商品標題輸入預設的商品屬性模型之前,還包括:
通過所述字向量表和所述詞向量表,向量化訓練樣本的商品標題,得到向量化的所述訓練樣本的商品標題;
依據所述向量化的所述訓練樣本的商品標題和所述訓練樣本的商品屬性,訓練商品屬性模型得到所述商品屬性模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810175616.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:展示設備、方法和系統
- 下一篇:一種高效量子產品營銷方法





