[發明專利]一種內容識別、內容分發方法、裝置及電子設備有效
| 申請號: | 201810765617.0 | 申請日: | 2018-07-12 |
| 公開(公告)號: | CN109189918B | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 王志華;宋華;查強 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;H04L29/08 |
| 代理公司: | 北京柏杉松知識產權代理事務所(普通合伙) 11413 | 代理人: | 李欣;項京 |
| 地址: | 100080 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 內容 識別 分發 方法 裝置 電子設備 | ||
本發明實施例提供了一種內容識別、內容分發方法、裝置及電子設備,涉及數據處理技術領域,內容識別方法包括:對待識別內容的標題進行預處理,獲得至少一個標題字和/或詞;將各個標題字和/或詞按其在標題中出現的順序輸入至預設的基于長短期記憶循環神經網絡LSTM的深度內容分類模型;深度內容分類模型,按輸入的順序對標題字和/或詞進行順序計算,獲得標題為深度內容標題的概率,若概率大于預設概率閾值,則待識別內容為深度內容,若概率不大于預設概率閾值,則待識別內容為非深度內容。采用本發明實施例可以自動識別深度內容,基于內容識別方法,內容分發方法可以將識別出的深度內容有針對性地分發給用戶。
技術領域
本發明涉及數據處理技術領域,特別是涉及一種內容識別、內容分發方法、裝置及電子設備。
背景技術
近年來,隨著網絡技術的發展,人們可以越來越便捷的從網絡中獲取新內容,同時也對內容的質量要求越來越高。新媒體時代催生了海量的用戶原創內容(User GeneratedContent,簡稱UGC),這些自媒體借助各內容分發平臺推薦算法將自制內容分發給用戶,用戶的反饋由反作用于推薦算法和內容生產,形成了良好的環路生態。
但是海量自制內容也給內容分發平臺帶來了極大的挑戰,內容分發平臺需要從海量數據中分辨出有知識性的、能夠引發用戶思考的深度內容和泛娛樂化的非深度內容,如果不將內容進行分類,那么這些非深度內容會占用大量的用戶碎片時間,易造成用戶的流失。
現有技術中,內容分發平臺對于深度內容的識別一般都是靠人工審核,將所有的用戶上傳內容經人工判斷是否為深度內容,再入庫。
另一方面,內容分發平臺一般是將內容庫中的深度內容分發給所有的用戶。
然而,發明人在實現本發明的過程中發現,所有的用戶上傳內容都需要依靠人工審核,需要耗費大量的人力和時間,且不是所有的用戶對深度內容都有消費意愿,現有技術不能對深度內容做到定向分發。
可見,現有技術中深度內容的分發,不能自動識別深度內容與非深度內容,需要借助大量的人力,耗時長,深度內容無法及時分發給用戶,且無法判斷分發的用戶是否對深度內容有消費意愿,操作流程不夠方便,分發對象不夠明確。
發明內容
本發明實施例的目的在于提供一種內容識別、內容分發方法、裝置及電子設備,以分別實現自動識別深度內容和有針對性地將其分發給用戶。具體技術方案如下:
第一方面,提供了一種內容識別方法,所述方法包括:
獲得待識別內容的標題;
對所述待識別內容的標題進行預處理,獲得至少一個標題字和/或詞;
將各個標題字和/或詞按其在標題中出現的順序輸入至預設的基于長短期記憶循環神經網絡LSTM的深度內容分類模型;所述預設的LSTM深度內容分類模型是通過收集精華內容得到的正樣本和收集的非精華內容得到的負樣本訓練后的模型;
所述深度內容分類模型,按輸入的順序對標題字和/或詞進行順序計算,獲得標題為深度內容標題的概率,若所述概率大于預設概率閾值,則所述待識別內容為深度內容,若所述概率不大于預設概率閾值,則所述待識別內容為非深度內容。
可選的,所述基于LSTM的深度內容分類模型的訓練步驟,包括:
獲得預設數量的深度內容標題和非深度內容標題,分別添加正樣本或負樣本的標簽,作為深度內容的正樣本和負樣本;
利用深度內容的正樣本和負樣本,分別利用指定的各個預處理方式對LSTM神經網絡進行訓練。
可選的,所述獲得預設數量的深度內容標題和非深度內容標題,分別添加正樣本或負樣本的標簽,作為深度內容的正樣本和負樣本的步驟,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810765617.0/2.html,轉載請聲明來源鉆瓜專利網。
- 內容再現系統、內容提供方法、內容再現裝置、內容提供裝置、內容再現程序和內容提供程序
- 內容記錄系統、內容記錄方法、內容記錄設備和內容接收設備
- 內容服務系統、內容服務器、內容終端及內容服務方法
- 內容分發系統、內容分發裝置、內容再生終端及內容分發方法
- 內容發布、內容獲取的方法、內容發布裝置及內容傳播系統
- 內容提供裝置、內容提供方法、內容再現裝置、內容再現方法
- 內容傳輸設備、內容傳輸方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容發送設備、內容發送方法、內容再現設備、內容再現方法、程序及內容分發系統
- 內容再現裝置、內容再現方法、內容再現程序及內容提供系統
- 內容記錄裝置、內容編輯裝置、內容再生裝置、內容記錄方法、內容編輯方法、以及內容再生方法





