[發明專利]視頻數據處理方法和裝置在審
| 申請號: | 201811633133.7 | 申請日: | 2018-12-29 |
| 公開(公告)號: | CN109840291A | 公開(公告)日: | 2019-06-04 |
| 發明(設計)人: | 王丁南 | 申請(專利權)人: | 網易傳媒科技(北京)有限公司 |
| 主分類號: | G06F16/75 | 分類號: | G06F16/75;H04N21/44;H04N21/4545;H04N21/8549 |
| 代理公司: | 北京漢昊知識產權代理事務所(普通合伙) 11370 | 代理人: | 朱海波 |
| 地址: | 100084 北京市海淀區西北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻數據 視頻數據處理 方法和裝置 視頻源數據 標簽信息 準確度 流程處理 用戶體驗 分類 過濾 標簽 期望 保證 | ||
本發明的實施方式提供了一種視頻數據處理方法和裝置,包括:獲取視頻源數據;過濾視頻源數據獲得所期望的視頻數據;提取視頻數據的標簽信息;根據標簽信息將視頻數據分類,得到分類完成的視頻數據。本發明公開的技術方案,流程處理效率高、標簽準確度高,能夠保證良好的用戶體驗。
技術領域
本發明的實施方式涉及計算機技術領域,更具體地,本發明的實施方式涉及一種視頻數據處理方法和裝置。
背景技術
隨著內容資訊行業的發展,很多自媒體平臺都加大了對視頻內容,尤其是短視頻內容的重視程度,自媒體短視頻數據也呈指數倍增長,但各內容資訊平臺對短視頻自媒體大數據的流程處理都還處于較初始的探索階段。
現有技術中,對視頻數據的處理還依賴人力審核,一方面需要人工檢驗視頻數據是否為低俗、色情、標題黨、清晰度過差等不符合內容規則及影響用戶體檢的視頻;另一方面還需要人工修正內容發布者填寫的分類、關鍵詞、時效等標簽信息。
因此,現有技術存在依賴人工審核,視頻數據處理效率低、標簽準確度低等缺點。
發明內容
本發明實施例提供了一種視頻數據處理方法和裝置。旨在解決現有技術中視頻數據處理效率低、標簽準確度低的問題。為了對披露的實施例的一些方面有一個基本的理解,下面給出了簡單的概括。該概括部分不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍。
在本發明實施方式的第一方面中,提供了一種視頻數據處理方法,包括:
獲取視頻源數據;
過濾視頻源數據獲得所期望的視頻數據;
提取視頻數據的標簽信息;
根據標簽信息將視頻數據分類,得到分類完成的視頻數據。
在本發明的一個實施例中,過濾視頻源數據獲得所期望的視頻數據的步驟包括:
獲取預先建設的反垃圾策略規則;
基于反垃圾策略規則執行過濾,以便基于視頻源數據獲得所期望的視頻數據。
在本發明的一個實施例中,反垃圾策略規則包括標題規則、內容規則和標題-內容對應規則。
在本發明的一個實施例中,基于反垃圾策略規則執行過濾,以便基于視頻源數據獲得所期望的視頻數據的步驟包括:
確定視頻源數據的標題形式和標題內容是否符合標題規則;
若是,確定視頻源數據的內容是否符合內容規則;
若是,確定視頻源數據的標題和內容相關性是否符合標題-內容對應規則;
若是,則確定視頻數據為所期望的視頻數據。
在本發明的一個實施例中,確定視頻源數據的內容是否符合內容規則的步驟包括:
抽取視頻源數據的封面和多幀內容畫面;
識別封面和多幀內容畫面;
根據識別結果確認封面和多幀內容畫面是否符合內容規則。
在本發明的一個實施例中,確定視頻源數據的內容是否符合標題-內容對應規則的步驟包括:
抽取視頻源數據的多幀內容畫面;
識別多幀內容畫面;
根據識別結果確定視頻源數據的視頻內容和標題內容是否符合標題-內容對應規則。
在本發明的一個實施例中,確定視頻源數據的內容是否符合內容規則的步驟包括:
抽取視頻源數據的多幀內容畫面;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于網易傳媒科技(北京)有限公司,未經網易傳媒科技(北京)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811633133.7/2.html,轉載請聲明來源鉆瓜專利網。





