[發明專利]一種美妝直播功效話術監測方法和系統在審
| 申請號: | 202111494792.9 | 申請日: | 2021-12-08 |
| 公開(公告)號: | CN114168711A | 公開(公告)日: | 2022-03-11 |
| 發明(設計)人: | 湯偉杰 | 申請(專利權)人: | 上海樂項信息技術有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/335;G06F16/28;G06Q30/00 |
| 代理公司: | 北京天盾知識產權代理有限公司 11421 | 代理人: | 張彩珍 |
| 地址: | 200131 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 直播 功效 監測 方法 系統 | ||
本發明公開了一種美妝直播功效話術監測方法及系統,包括構建國妝網備案產品信息庫和美妝產品合規話術庫,合并國妝網備案產品信息庫和美妝產品合規話術庫以生成國妝備案產品合規話術庫;實時獲取語音數據以生成實時文本數據;構建美妝行業話術標簽庫,基于美妝行業話術標簽庫對實時文本數據進行打標,標注出屬于美妝護膚品介紹或美妝彩妝介紹的第一話術和屬于美妝功效話術的第二話術;篩選出第二話術,并將第二話術和國妝備案產品合規話術庫中的合規話術進行相似度匹配;若匹配度低于閾值,則進行話術預警;該方法能有效監測美妝功效類話術是否合規,避免直播中出現夸大產品功效、虛假宣傳等違規話術,保障消費者知情權等合法權益。
技術領域
本發明涉及音視頻檢測技術領域,具體涉及一種美妝直播功效話術監測方法和系統。
背景技術
隨著直播帶貨業務越來越火爆,行業監管也逐漸趨嚴,直播話術的內容把控成為NLP領域急需解決的痛點;無論從品牌方還是MCN角度,直播話術的監管都迫在眉睫。
在美妝直播中對產品的功效描述必不可少,直播中有時會出現夸大產品功效、虛假宣傳等違規話術,例如存在4周內改善痘印淡化細紋、12周內提升肌膚自愈力等內容無事實依據、夸大產品功效的違規話術;在2021年6月還出現雅詩蘭黛因直播過程中存在虛假宣傳被罰40萬元的事件,其微博話題“雅詩蘭黛因虛假宣傳被罰40萬”引發超3億閱讀量,約1.1萬條討論,使得雅詩蘭黛品牌形象受損。
而目前并沒有針對美妝直播功效話術進行監測的方法,因此不能對美妝行業主播話術進行把控及監管,導致直播中出現夸大產品功效、虛假宣傳等違規話術,不能促進美妝直播行業健康發展。
發明內容
針對上述問題,本發明的一個目的是提供一種美妝直播功效話術監測方法,該方法能有效監測美妝功效類話術是否合規,避免直播中出現夸大產品功效、虛假宣傳等違規話術以及直播間PR公關風險,保障消費者知情權等合法權益。
本發明的第二個目的是提供一種美妝直播功效話術監測系統。
本發明所采用的第一個技術方案是:一種美妝直播功效話術監測方法,包括以下步驟:
S100:構建預定產品信息庫和美妝產品合規話術庫,合并所述預定產品信息庫和所述美妝產品合規話術庫以生成預定產品合規話術庫;
S200:實時獲取語音數據以生成實時文本數據;
S300:構建美妝行業話術標簽庫,基于所述美妝行業話術標簽庫對所述實時文本數據進行打標,以標注出屬于美妝產品介紹的第一話術和屬于美妝功效話術的第二話術;
S400:篩選出所述第二話術,并將所述第二話術和所述預定產品合規話術庫中的合規話術進行相似度匹配;若匹配度低于閾值,則進行話術預警。
優選地,所述步驟S100包括:
將所有預定的美妝產品以產品名成分名使用目的的數據格式導入MySQL數據庫,形成預定產品信息庫;
將美妝產品合規的產品介紹話術以直播間鏈接直播間昵稱合規話術的數據格式導入MySQL數據庫,形成美妝產品合規話術庫。
優選地,所述步驟S200具體為:利用自動語音識別算法將實時獲取的語音數據轉寫成實時文本數據;所述自動語音識別算法經過以下語料預訓練:
將待訓練語料庫中的話術語料進行TF-IDF權重賦值;
將所有賦值后的詞語按照分值從高到低進行排序以得到話術預訓練分值;
在自動語音識別遇到同音字時,基于話術預訓練分值從高到低地進行匹配。
優選地,所述步驟S300中構建美妝行業話術標簽庫包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海樂項信息技術有限公司,未經上海樂項信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111494792.9/2.html,轉載請聲明來源鉆瓜專利網。





