[發明專利]數據處理方法、計算機設備以及可讀存儲介質有效

申請號：	202111194096.6	申請日：	2021-10-13
公開（公告）號：	CN113642536B	公開（公告）日：	2021-12-24
發明（設計）人：	陳小帥	申請（專利權）人：	騰訊科技（深圳）有限公司
主分類號：	G06K9/00	分類號：	G06K9/00;G06K9/20;G06K9/34;G06K9/62;G06F16/75;G06F16/73;G10L15/26
代理公司：	廣州三環專利商標代理有限公司 44202	代理人：	熊永強;杜維
地址：	518057 廣東省深圳***	國省代碼：	廣東;44
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	數據處理方法計算機設備以及可讀存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本申請實施例公開了一種數據處理方法、計算機設備以及可讀存儲介質，其中方法包括：獲取目標視頻中的視頻文本素材，根據視頻文本素材識別目標視頻對應的視頻分類信息；將視頻文本素材和視頻分類信息輸入到基于視頻事件時間庫訓練得到的序列標注模型中，通過序列標注模型輸出針對目標視頻的預測結果；根據預測結果確定用于與目標視頻進行關聯的目標時間。本申請實施例可以應用于云技術、人工智能、智慧交通、輔助駕駛等各種場景。采用本申請，可以提高識別視頻的相關時間的效率。

技術領域

本申請涉及互聯網技術領域，尤其涉及一種數據處理方法、計算機設備以及可讀存儲介質。

背景技術

隨著多媒體在生活中應用愈加廣泛，視頻信息的精準推送越來越受人重視。在不同的時間點，相同的視頻所傳遞給人們的信息含量也會不同，識別視頻的相關時間有助于視頻精準推送，將視頻所傳遞的消息有效利用。

實際應用時，精準地識別視頻的相關時間，對視頻信息的及時傳輸具有重要意義。

當前市場上，通過人工標注的方式對視頻進行人工分析，通過人工分析結果確定出視頻的相關時間。但是，通過人工標注的方式對視頻的相關時間進行挖掘需要花費大量時間，可見目前識別視頻相關時間的效率低下。

發明內容

本申請實施例提供一種數據處理方法、計算機設備以及可讀存儲介質，可以提高識別視頻相關時間的效率。

本申請一方面提供了一種數據處理方法，包括：

獲取目標視頻中的視頻文本素材，根據視頻文本素材識別目標視頻對應的視頻分類信息；

將視頻文本素材和視頻分類信息輸入到基于視頻事件時間庫訓練得到的序列標注模型中，通過序列標注模型輸出針對目標視頻的預測結果；視頻事件時間庫包括至少兩個視頻，以及與每個視頻分別映射的事件和時間；序列標注模型是通過以視頻事件時間庫中的至少兩個視頻為訓練樣本、以及以與每個視頻分別映射的事件和時間為訓練標簽訓練得到的；

根據預測結果確定用于與目標視頻進行關聯的目標時間。

進一步地，還包括：

將視頻事件時間庫中的至少兩個視頻確定為訓練樣本，將與每個視頻分別映射的事件和時間確定為訓練標簽；

獲取訓練樣本中的樣本文本素材，根據樣本文本素材識別訓練樣本對應的樣本分類信息；

將樣本文本素材和樣本分類信息輸入到初始序列標注模型中，通過初始序列標注模型輸出針對訓練樣本的樣本預測結果；

根據樣本預測結果和訓練標簽生成模型損失值，根據模型損失值對初始序列標注模型進行模型參數調整，得到序列標注模型。

進一步地，獲取目標視頻中的視頻文本素材，根據視頻文本素材識別目標視頻對應的視頻分類信息，包括：

獲取目標視頻中的標題文本素材；

對目標視頻中的每一幀圖像中的文本內容進行光學識別，得到字幕文本素材；

獲取目標視頻中的音頻數據，對音頻數據進行語音識別，得到目標視頻中的對白文本素材；

將標題文本素材、字幕文本素材和對白文本素材確定為目標視頻的識別文本素材；

若目標視頻所關聯的對象后驗數據滿足視頻識別條件，則將識別文本素材與對象后驗數據確定為目標視頻的視頻文本素材，根據視頻文本素材識別目標視頻對應的視頻分類信息。