[發明專利]一種基于社交電商公開文本信息的商品細粒度分類方法有效
| 申請號: | 202011141195.3 | 申請日: | 2020-10-23 |
| 公開(公告)號: | CN112632273B | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 陳軼;張文;崔浩亮;牛少彰;王讓定 | 申請(專利權)人: | 東南數字經濟發展研究院 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06Q30/0601 |
| 代理公司: | 深圳紫晴專利代理事務所(普通合伙) 44646 | 代理人: | 陳彩云 |
| 地址: | 324000 浙江省衢州市*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 社交 公開 文本 信息 商品 細粒度 分類 方法 | ||
1.一種基于社交電商公開文本信息的商品細粒度分類方法,其特征在于,包括以下步驟:
步驟S1:從數據庫讀取社交電商對于商品的公開描述文本信息,根據商品屬性建立一級目錄標簽,并根據標簽的不同將文本信息分成若干類數據集;
步驟S2:對社交電商公開文本進行詞性標注,參照一級目錄標簽,選擇商品公開描述文本中與一級目錄標簽為被包含關系的名詞性詞語作為其二級目錄標簽;
步驟S3:根據文本在上述一級目錄標簽中的分類結果調用該一級目錄下的二級目錄標簽數據,并檢索該名詞性詞語與二級目錄中相同的標簽數據,得到文本所屬細粒度類別。
2.根據權利要求1所述的一種基于社交電商公開文本信息的商品細粒度分類方法,其特征在于,在S1中,所述的商品屬性參照已公開的購物網站的一級目錄分類。
3.根據權利要求1所述的一種基于社交電商公開文本信息的商品細粒度分類方法,其特征在于,將S1中的數據集分成訓練集、測試集和驗證集并利用文本分類算法對訓練集、測試集和驗證集分別進行模型訓練、測試和驗證。
4.根據權利要求3所述的一種基于社交電商公開文本信息的商品細粒度分類方法,其特征在于,所述的文本分類算法包括BERT、LSTM、TextCNN中的一種或多種。
5.根據權利要求3所述的一種基于社交電商公開文本信息的商品細粒度分類方法,其特征在于,分類模型訓練完成后對文本類別進行預測。
6.根據權利要求1所述的一種基于社交電商公開文本信息的商品細粒度分類方法,其特征在于,在S2中使用jieba開源軟件包提供的算法模板進行詞性標注。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于東南數字經濟發展研究院,未經東南數字經濟發展研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011141195.3/1.html,轉載請聲明來源鉆瓜專利網。





