[發明專利]用戶產生內容過濾方法及相關裝置在審
| 申請號: | 202010075298.8 | 申請日: | 2020-01-22 |
| 公開(公告)號: | CN113157901A | 公開(公告)日: | 2021-07-23 |
| 發明(設計)人: | 劉剛 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/35;G06F16/9535 |
| 代理公司: | 深圳市隆天聯鼎知識產權代理有限公司 44232 | 代理人: | 魏學昊 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 產生 內容 過濾 方法 相關 裝置 | ||
1.一種用戶產生內容過濾方法,其特征在于,包括:
獲取用戶產生內容的多個維度向量,所述多個維度向量包括詞向量和句向量;
將所述多維度向量輸入關鍵詞庫和/或種子庫和/或內容類型評價模型以確定所述用戶產生內容的內容類型,所述關鍵詞庫中包含關鍵詞詞向量樣本,所述種子庫中包含句向量樣本,所述內容類型評價模型通過多個子評價模型構建;
在所述內容類型為目標類型時,濾除所述用戶產生內容。
2.根據權利要求1所述的方法,其特征在于,還包括:
通過基于詞向量的textcnn模型、基于句向量的textcnn-like卷積網絡模型以及基于詞向量、句向量的svm模型構建所述內容類型評價模型。
3.根據權利要求2所述的方法,其特征在于,將所述多維度向量輸入內容類型評價模型以確定所述用戶產生內容的內容類型,包括:
將所述多維度向量輸入基于詞向量的textcnn模型中,生成第一評價結果;
將所述多維度向量輸入基于句向量的textcnn-like卷積網絡模型中,生成第二評價結果;
將所述多維度向量輸入基于詞向量、句向量的svm模型中,生成第三評價結果;
通過所述第一評價結果、第二評價結果、第三評價結果確定所述用戶產生內容的內容類型。
4.根據權利要求3所述的方法,其特征在于,通過所述第一評價結果、第二評價結果、第三評價結果確定所述用戶產生內容的內容類型包括:
根據融合策略,利用所述第一評價結果、第二評價結果、第三評價結果確定所述用戶產生內容的內容類型,所述融合策略用于指示多個評價結果的聯合評價策略。
5.根據權利要求1所述的方法,其特征在于,將所述多維度向量輸入關鍵詞庫以確定所述用戶產生內容的內容類型,包括:
將所述關鍵詞庫中的關鍵詞的詞向量樣本與所述多維度向量中的詞向量進行比較;
在所述關鍵詞的詞向量樣本與所述多維度向量中的詞向量存在相同的詞向量樣本時,確定所述用戶產生的內容類型為目標類型。
6.根據權利要求1所述的方法,其特征在于,將所述多維度向量輸入種子庫以確定所述用戶產生內容的內容類型,包括:
計算所述多維度向量中的句向量和所述種子庫中句向量樣本的相似度;
在所述相似度大于預定閾值時,確定所述用戶產生的內容類型為目標類型。
7.根據權利要求1所述的方法,其特征在于,所述關鍵詞庫,包括:
第一關鍵詞庫,所述第一關鍵詞庫中存儲低俗類型關鍵詞的詞向量樣本;
第二關鍵詞庫,所述第二關鍵詞庫中存儲謾罵類型關鍵詞的詞向量樣本。
8.根據權利要求1所述的方法,其特征在于,所述種子庫,包括:
第一種子庫,所述第一種子庫中存儲低俗類型文本的句向量樣本;
第二種子庫,所述第二種子庫中存儲騙取點贊類型文本的句向量樣本。
9.根據權利要求1所述的方法,其特征在于,所述內容類型評價模型,包括:
第一內容類型評價模型,所述第一內容類型評價模型用于評價所述用戶產生內容是否為低俗類型內容;
第二內容類型評價模型,所述第二內容類型評價模型用于評價所述用戶產生內容是否為謾罵類型內容;
第三內容類型評價模型,所述第三內容類型評價模型用于評價所述用戶產生內容是否為騙取點贊類型內容。
10.一種用戶產生內容過濾裝置,其特征在于,包括:
獲取模塊,用于獲取用戶產生內容的多個維度向量,所述多個維度向量包括詞向量和句向量;
評價模塊,用于將所述多維度向量輸入關鍵詞庫和/或種子庫和/或內容類型評價模型以確定所述用戶產生內容的內容類型,所述關鍵詞庫中包含關鍵詞詞向量樣本,所述種子庫中包含句向量樣本,所述內容類型評價模型通過多個子評價模型構建;
濾除模塊,用于在所述內容類型為目標類型時,濾除所述用戶產生內容。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010075298.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種房間狀態更新方法、裝置、設備和存儲介質
- 下一篇:智能門系統
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





