[發明專利]一種用于廣告投放的投放輿情監測方法在審
| 申請號: | 202011254069.9 | 申請日: | 2020-11-11 |
| 公開(公告)號: | CN112307212A | 公開(公告)日: | 2021-02-02 |
| 發明(設計)人: | 田東坡 | 申請(專利權)人: | 上海昌投網絡科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F16/951;G06K9/62 |
| 代理公司: | 上海尚象專利代理有限公司 31335 | 代理人: | 徐炫 |
| 地址: | 200120 上海市浦東新區中國(上海)自由貿易*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 廣告 投放 輿情 監測 方法 | ||
1.一種用于廣告投放的投放輿情監測方法,其特征在于,所述的方法是通過bert、albert、roberta三種深度學習模型,根據廣告投放后用戶評論數據,采用多個模型融合,訓練或預訓練模型,提取文本特征,增強數據,并生成相似語料,作為語料擴充,再應用于下游的輿情分類任務中解決標注數據少的問題。
2.如權利要求1所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的方法包含:
步驟1、使用爬蟲技術從投放廣告渠道爬取投放廣告發文下的評論,并存儲評論到數據庫;
步驟2、使用輿情監控數據增強和語料生成模塊對數據進行擴充和增強;
步驟3、分別使用bert、albert、roberta算法構建模型;
步驟4、采用多模型融合方案,融合bert、albert、roberta三個模型所得的結果;
步驟5、完成線上環境部署和優化。
3.如權利要求2所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的步驟1中的渠道包含抖音、快手、B站。
4.如權利要求2所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的步驟2中的數據增強和語料生成模塊是使用增刪改換、基于詞性和句法替換關鍵詞、回譯、深度學習生成相融合的方式進行數據增強,并生成語料。
5.如權利要求2所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的步驟3中的bert、albert、roberta三個模型都是使用Transformer結構的預訓練模型。
6.如權利要求5所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的步驟3中的bert是開源預訓練模型,albert是對bert模型的優化模型,roberta是對bert的另一種優化模型。
7.如權利要求2所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的步驟5中的線上環境部署是部署在兩臺RTX600024G的GPU服務器,線上環境優化服務性能解決高并發問題,響應速度控制在300ms以內。
8.如權利要求7所述的用于廣告投放的投放輿情監測方法,其特征在于,所述的優化,其過程包含:模型計算圖的GPU并行計算、bert預處理過程并行計算、多模型并行計算。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海昌投網絡科技有限公司,未經上海昌投網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011254069.9/1.html,轉載請聲明來源鉆瓜專利網。





