[發明專利]一種美妝直播功效話術監測方法和系統在審
| 申請號: | 202111494792.9 | 申請日: | 2021-12-08 |
| 公開(公告)號: | CN114168711A | 公開(公告)日: | 2022-03-11 |
| 發明(設計)人: | 湯偉杰 | 申請(專利權)人: | 上海樂項信息技術有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F16/28;G06Q30/00 |
| 代理公司: | 北京天盾知識產權代理有限公司 11421 | 代理人: | 張彩珍 |
| 地址: | 200131 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 直播 功效 監測 方法 系統 | ||
1.一種美妝直播功效話術監測方法,其特征在于,包括以下步驟:
S100:構建預定產品信息庫和美妝產品合規話術庫,合并所述預定產品信息庫和所述美妝產品合規話術庫以生成預定產品合規話術庫;
S200:實時獲取語音數據以生成實時文本數據;
S300:構建美妝行業話術標簽庫,基于所述美妝行業話術標簽庫對所述實時文本數據進行打標,以標注出屬于美妝產品介紹的第一話術和屬于美妝功效話術的第二話術;
S400:篩選出所述第二話術,并將所述第二話術和所述預訂產品合規話術庫中的合規話術進行相似度匹配;若匹配度低于閾值,則進行話術預警。
2.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述步驟S100包括:
將所有預定的美妝產品以產品名成分名使用目的的數據格式導入MySQL數據庫,形成預定產品信息庫;
將美妝產品合規的產品介紹話術以直播間鏈接直播間昵稱合規話術的數據格式導入MySQL數據庫,形成美妝產品合規話術庫。
3.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述步驟S200具體為:利用自動語音識別算法將實時獲取的語音數據轉寫成實時文本數據;所述自動語音識別算法經過以下語料預訓練:
將待訓練語料庫中的話術語料進行TF-IDF權重賦值;
將所有賦值后的詞語按照分值從高到低進行排序以得到話術預訓練分值;
在自動語音識別遇到同音字時,基于話術預訓練分值從高到低地進行匹配。
4.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述步驟S300中構建美妝行業話術標簽庫包括:
基于話術類別和標簽構建美妝行業話術標簽庫;所述話術類別包括美妝產品介紹和美妝功效話術。
5.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述步驟S300中第一話術和第二話術通過以下方式獲得:
將實時文本數據進行段落劃分得到第一段落;
觸發第一段落中關于美妝產品名稱、使用部位或使用方式類的關鍵詞;當第一段落中觸發的關鍵詞出現的頻次超過閾值,則基于所述美妝行業話術標簽庫對所述第一段落進行打標,標注為屬于美妝產品介紹的第一話術;
在第一話術中以成分或功效類關鍵詞進行定位,鎖定關鍵詞前后一定字數的話術段落得到第二段落;當第二段落中成分或功效類關鍵詞出現的頻次超過閾值,則基于所述美妝行業話術標簽庫對所述第二段落進行打標,標注為屬于美妝功效話術的第二話術。
6.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述步驟S300還包括:
基于第一話術和第一話術段落的時間區間對應的銷售轉化率通過AB測試自動篩選出應用在不同美妝直播場景里的優質話術。
7.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述步驟S400中將所述第二話術和所述預定產品合規話術庫中的合規話術進行相似度匹配包括以下子步驟:
S410:基于第一話術識別第二話術對應的美妝產品名稱;
S420:基于所述美妝產品名稱在所述預定產品合規話術庫中映射找到所述美妝產品對應的合規話術;
S430:將所述第二話術與所述合規話術采用自然語言處理技術進行余弦相似度匹配。
8.根據權利要求1所述的美妝直播功效話術監測方法,其特征在于,所述余弦相似度匹配包括以下子步驟:
S431:采用中文分詞庫對所述第二話術進行中文分詞得到分詞后的文本;
S432:將所述分詞后的文本進行word2vec詞向量計算并建模獲得第二話術中的詞向量;
S433:將第二話術中的詞向量與合規話術中的詞向量進行余弦相似度計算。
9.根據權利要求8所述的美妝直播功效話術監測方法,其特征在于,在所述步驟S431之前還包括對預定產品合規話術庫中的合規話術進行word2vec詞向量計算及建模,并預先緩存在Redis中。
10.一種美妝直播功效話術監測系統,其特征在于,包括預定產品合規話術庫構建模塊、語音轉寫模塊、標注模塊和匹配模塊;
所述預定產品合規話術庫構建模塊用于構建預定產品信息庫和美妝產品合規話術庫,合并所述預定產品信息庫和所述美妝產品合規話術庫以生成預定產品合規話術庫;
所述語音轉寫模塊用于實時獲取語音數據以生成實時文本數據;
所述標注模塊用于構建美妝行業話術標簽庫,基于所述美妝行業話術標簽庫對所述實時文本數據進行打標,以標注出屬于美妝產品介紹的第一話術和屬于美妝功效話術的第二話術;
所述匹配模塊用于篩選出所述第二話術,并將所述第二話術和所述預定產品合規話術庫中的合規話術進行相似度匹配;若匹配度低于閾值,則進行話術預警。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海樂項信息技術有限公司,未經上海樂項信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111494792.9/1.html,轉載請聲明來源鉆瓜專利網。





