[發(fā)明專利]確定商品屬性的方法、裝置、設備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810175616.0 | 申請日: | 2018-03-02 |
| 公開(公告)號: | CN110223095A | 公開(公告)日: | 2019-09-10 |
| 發(fā)明(設計)人: | 徐揚 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02;G06F17/27 |
| 代理公司: | 北京東方億思知識產(chǎn)權(quán)代理有限責任公司 11258 | 代理人: | 彭瓊 |
| 地址: | 開曼群島*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 商品屬性 向量化 存儲介質(zhì) 準確率 分詞 輸出 | ||
1.一種確定商品屬性的方法,其特征在于,包括:
獲取商品標題;
對所述商品標題進行分字分詞;
向量化所述分字分字后的商品標題得到向量化的商品標題;
將所述向量化的商品標題輸入商品屬性模型中,輸出所述商品標題對應的商品屬性。
2.根據(jù)權(quán)利要求1所述確定商品屬性的方法,其特征在于,所述對所述商品標題進行分字分詞,包括:
結(jié)合高頻詞匯對所述商品標題進行分字分詞。
3.根據(jù)權(quán)利要求2所述確定商品屬性的方法,其特征在于,所述結(jié)合高頻詞匯對所述商品標題進行分字分詞,包括:
結(jié)合高頻詞匯對所述商品標題進行分詞,然后將所述商品標題中除高頻詞匯以外字符進行分字。
4.根據(jù)權(quán)利要求2所述確定商品屬性的方法,其特征在于,所述結(jié)合高頻詞匯對所述商品標題進行分字分詞之前,還包括:
對訓練樣本中的商品標題進行分詞得到分詞結(jié)果;
統(tǒng)計分詞結(jié)果,獲得所述高頻詞匯。
5.根據(jù)權(quán)利要求4所述確定商品屬性的方法,其特征在于,所述獲得所述高頻詞匯之后,還包括:
在所述高頻詞匯中添加專業(yè)詞匯,以更新所述高頻詞匯。
6.根據(jù)權(quán)利要求1所述確定商品屬性的方法,其特征在于,所述向量化所述分字分字后的商品標題得到向量化的商品標題,包括:
利用字向量表和詞向量表,向量化所述分字分字后的商品標題得到向量化的商品標題。
7.根據(jù)權(quán)利要求6所述確定商品屬性的方法,其特征在于,所述字向量表是利用高頻詞匯分割后的訓練樣本中的商品標題訓練字向量后得到的向量表;
所述詞向量表是利用高頻詞匯分割后的訓練樣本中的商品標題訓練詞向量后得到的向量表。
8.根據(jù)權(quán)利要求6所述確定商品屬性的方法,其特征在于,所述字向量表是利用Skip-Gram模型或CBOW模型訓練字向量得到的向量表;
所述詞向量表是利用Skip-Gram模型或CBOW模型訓練詞向量得到的向量表。
9.根據(jù)權(quán)利要求6所述確定商品屬性的方法,其特征在于,所述將所述向量化的商品標題輸入預設的商品屬性模型之前,還包括:
通過所述字向量表和所述詞向量表,向量化訓練樣本的商品標題,得到向量化的所述訓練樣本的商品標題;
依據(jù)所述向量化的所述訓練樣本的商品標題和所述訓練樣本的商品屬性,訓練商品屬性模型得到所述商品屬性模型。
10.根據(jù)權(quán)利要求9所述確定商品屬性的方法,其特征在于,所述依據(jù)所述向量化的所述訓練樣本的商品標題和所述訓練樣本的商品屬性,訓練商品屬性模型得到所述商品屬性模型,包括:
依據(jù)所述向量化的所述訓練樣本的商品標題和所述訓練樣本的商品屬性,基于分類器訓練商品屬性模型得到所述商品屬性模型。
11.根據(jù)權(quán)利要求10所述確定商品屬性的方法,其特征在于,所述分類器包括決策樹、邏輯回歸、貝葉斯、神經(jīng)網(wǎng)絡、隨機森林或支持向量機。
12.一種確定商品屬性的方法,其特征在于,包括:
接收用戶輸入的詞匯字符和用戶輸入的非詞匯字符;
依據(jù)所述用戶輸入的詞匯字符、所述用戶輸入的詞匯字符的順序、所述用戶輸入的非詞匯字符和所述用戶輸入的非詞匯字符的順序,構(gòu)建商品標題;
發(fā)送所述商品標題以確定商品屬性。
13.根據(jù)權(quán)利要求12所述確定商品屬性的方法,其特征在于,所述接收用戶輸入的詞匯字符和用戶輸入的非詞匯字符,包括:
接收用戶調(diào)用輸入法輸入的詞匯字符,以及調(diào)用輸入法輸入的非詞匯字符。
該專利技術資料僅供研究查看技術是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810175616.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





