[發明專利]一種電商評論多類目多客戶快速定制化模型的方法和裝置在審
| 申請號: | 201910161179.1 | 申請日: | 2019-03-04 |
| 公開(公告)號: | CN109902180A | 公開(公告)日: | 2019-06-18 |
| 發明(設計)人: | 李平章;王航;丁丁;鄭圓 | 申請(專利權)人: | 上海寶尊電子商務有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F17/27;G06Q30/06 |
| 代理公司: | 上海卓陽知識產權代理事務所(普通合伙) 31262 | 代理人: | 周春洪 |
| 地址: | 200436 上海市靜安*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 方法和裝置 快速定制 構建 類目 神經網絡模型 標注 客戶 評論 標簽 定制模型 快速訓練 訓練模塊 定制化 品牌 表現 | ||
1.一種電商評論多類目多客戶快速定制化模型的方法和裝置,其特征在于,所述的一種電商評論多類目多客戶快速定制化模型方法和裝置包括以下主要步驟:
第一:最低粒度標簽的構建:
S11.根據實際情況將訓練集拆分成最低粒度標簽,任意類目店鋪需要的標簽都可由最低粒度的標簽組合而成,若不能組合,說明非最低粒度,需要繼續拆分;
S12.根據新類目的引入會提出新的需求,導致原先最低粒度的標簽不再是最低粒度,需按照S11的方式拆分成最低粒度,例:AB是配送快,當前最低粒度;新用戶提出發貨快和送貨快的概念,則需要將原AB分拆成A發貨快,B送貨快;A和B就是新的最低粒度,AB不是;
第二:深度神經網絡模型訓練模塊的構建:
S21.將S12的數據使用卷積神經網絡進行訓練,使用訓練好的詞向量,將分詞結果轉換為詞向量;
S22.將轉換后的詞向量,使用2,3,4,5四種過濾器,分別做卷積與最大池化;
S23.定義損失函數,做全連接層進行sigmoid回歸輸出多分類概率;
S24.使用Adam優化算法訓練,保存模型;
第三:深度神經網絡模型標注模塊的構建:
S31.將評論數據分句,每個子句做為輸入文本;
S32.讀取訓練模型,將子句文本轉化為標簽分類概率,取大于0.5概率的標簽;
S33.將子句組合成原句,并保存子句標簽;
第四:標簽聚合模塊的構建:
S41.根據類目按圖2所示構建pool表,通過最低粒度匯聚成標簽。通過flag表示哪些是類目通用標簽,包含所有店鋪的,flag為N表示輔助標簽不顯示;
S42.構建change_name表,根據不同店鋪需要設定轉換需要改名的標簽;
S43.構建label_hide表,根據不同店鋪,隱藏非本店關注的類目通用標簽。
2.根據權利要求1所述的電商評論多類目多客戶快速定制化模型方法,其特征在于,所述步驟S12中,根據新增的定制化標簽,檢測是否含有當前最低粒度不可匯聚而成的標簽,有則需要將原有粒度拆分至最低粒度至可匯聚成新標簽。
3.根據權利要求1所述的電商評論多類目多客戶快速定制化模型方法,其特征在于,所述步驟S41中,設計了一個方法,按每個類目設定具體的標簽匯總方案,并顯示通用標簽模型,隱藏輔助標簽。
4.根據權利要求1所述的電商評論多類目多客戶快速定制化模型方法,其特征在于,所述步驟S42中,設計了一個方法,通過change_name表找到哪些客戶需要對通用標簽改名成符合自己的名字。
5.根據權利要求1所述的電商評論多類目多客戶快速定制化模型方法,其特征在于,所述步驟S43中,設計了一個方法;通過label_hide表找到哪些標簽對客戶隱藏。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海寶尊電子商務有限公司,未經上海寶尊電子商務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910161179.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于自然語言處理的篩選電商垃圾評論的方法
- 下一篇:文本的檢測方法及裝置





