[發明專利]面向電商領域的問題判別方法在審
| 申請號: | 202110141146.8 | 申請日: | 2021-02-01 |
| 公開(公告)號: | CN112836031A | 公開(公告)日: | 2021-05-25 |
| 發明(設計)人: | 王勤勤 | 申請(專利權)人: | 杭州微洱網絡科技有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/36;G06F40/289;G06K9/62;G06Q30/06 |
| 代理公司: | 杭州裕陽聯合專利代理有限公司 33289 | 代理人: | 張解翠 |
| 地址: | 311121 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 面向 領域 問題 判別 方法 | ||
本發明公開了一種面向電商領域的問題判別方法,該方法包含以下步驟:獲取訓練數據集;對訓練數據集進行打標簽;通過打標簽后的數據集對分類模型進行訓練;接收當前買家發送的問題;將問題輸入訓練好的分類模型得到分類結果。本發明的面向電商領域的問題判別方法,能夠很好的區別和發現商品級長尾問題和非商品級長尾問題,并根據問題的具體類型去做不同的處理,極大的提高智能客服機器人的智能化回復,從而提高了用戶體驗。
技術領域
本發明涉及一種面向電商領域的問題判別方法。
背景技術
通常在電商客服領域,為了應對日益增長的買家咨詢需求,商家一般會聘請大量的客服人員來處理各種需求,由此帶來了高的人工成本。
為了解決此問題,客服機器人應運而生。客服機器人可以為商家店鋪降低運營成本,提高運營效率。客服機器人通過自然語言處理技術智能化的處理買家各種文本需求。
現有的客服機器人都只能處理簡單且重復性較高的問題,然而現實中占比較多的長尾問題和尤其重要的關于商品詢問的問題不能發現和解決。
發明內容
本發明提供了一種面向電商領域的問題判別方法,采用如下的技術方案:
一種面向電商領域的問題判別方法,包含以下步驟:
獲取訓練數據集;
對訓練數據集進行打標簽,標簽包括商品級長尾問題和非商品級長尾問題;
通過打標簽后的數據集對分類模型進行訓練;
接收當前買家發送的問題;
將問題輸入訓練好的分類模型得到分類結果。
進一步地,獲取訓練數據集的具體方法為:
獲取若干買家發送的歷史語料信息;
從歷史語料信息中識別出所有用戶提問;
從用戶提問中識別出長尾問題作為訓練數據集。
進一步地,在獲取若干買家發送的歷史語料信息后,對歷史語料信息進行預處理。
進一步地,對訓練數據集進行打標簽的具體方法為:
將訓練數據集中的用戶提問分別打上商品級長尾問題和非商品級長尾問題兩類標簽。
進一步地,通過打標簽后的數據集對分類模型進行訓練的具體方法為:
將訓練數據集按比例分為訓練集、驗證集和測試集;
通過訓練集和驗證集預訓練分類模型;
通過測試集對分類模型進行測試。
進一步地,將訓練數據集按6:2:2的比例分為訓練集、驗證集和測試集。
進一步地,在對訓練數據集進行打標簽之后,面向電商領域的問題判別方法還包括;獲取商品屬性關鍵詞表;
將關鍵詞表作為輔助信息配合打標簽后的數據集對分類模型進行訓練。
進一步地,獲取商品屬性關鍵詞表的具體方法為:
使用商品名稱、商品賣點和商品描述等非結構化數據信息,通過分詞、詞頻等方法得到若干關鍵詞組成商品屬性關鍵詞表。
進一步地,在得到分類結果后,面向電商領域的問題判別方法還包括:
根據分類結果選擇對應的答復策略回復當前買家的問題。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州微洱網絡科技有限公司,未經杭州微洱網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110141146.8/2.html,轉載請聲明來源鉆瓜專利網。





