[發明專利]一種視頻處理方法、系統、設備及介質、程序產品在審
| 申請號: | 202310615111.2 | 申請日: | 2023-05-29 |
| 公開(公告)號: | CN116597360A | 公開(公告)日: | 2023-08-15 |
| 發明(設計)人: | 尹君豪;杜春賽;康積華;楊晶生 | 申請(專利權)人: | 北京字跳網絡技術有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V30/14;G06V30/19 |
| 代理公司: | 北京信遠達知識產權代理有限公司 11304 | 代理人: | 馮柳偉 |
| 地址: | 100190 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 處理 方法 系統 設備 介質 程序 產品 | ||
本申請提供了一種視頻處理方法、系統、設備及介質、程序產品。該方法包括:獲取待處理的視頻;根據待處理的視頻,確定視頻中的關鍵幀,關鍵幀為視頻的多個圖像幀中的至少一個;對關鍵幀的候選區域的內容進行識別,獲得關鍵幀的描述信息;呈現關鍵幀的描述信息。該方法通過對視頻中關鍵幀的候選區域的內容進行識別,可以獲得關鍵幀的描述信息,在本申請的一些具體應用場景中,例如在視頻會議場景中,可以獲得視頻當前演示的文檔的標題,使得用戶能夠了解視頻中多個關鍵幀的描述信息,從而便于用戶進行視頻定位,高效觀看視頻。
技術領域
本申請涉及人工智能技術領域,尤其涉及一種視頻處理方法、系統、設備以及計算機可讀存儲介質、計算機程序產品。
背景技術
視頻(video)是以電信號方式加以捕捉、記錄、處理、存儲、傳送與重現的動態影像。視頻中通常承載有比較豐富的信息,例如視頻內容可以包括具有大量文字的文檔。以會議場景示例說明,參會人員可以對會議過程中演示的文檔進行錄制,獲得記錄有文檔內容的視頻,以便于其他人員通過該視頻了解會議內容,或者參會人員通過該視頻回顧會議內容。
用戶在觀看視頻時,往往需要從頭開始觀看。若用戶想要針對特定部分的內容進行觀看,則需要定位到視頻中的特定時間點,再從該特定時間點進行觀看。然而,用戶通常需要進行多次手動定位,才能確定與所要觀看的特定部分對應的特定時間點,耗時耗力。
因此,業界亟需一種能夠高效觀看視頻的視頻處理方法。
發明內容
本申請提供了一種視頻處理方法。該方法能夠對視頻中關鍵幀的描述信息進行定位,便于用戶進行跳轉觀看,從而實現高效觀看視頻。本申請還提供了上述方法對應的系統、設備、計算機可讀存儲介質以及計算機程序產品。
第一方面,本申請提供了一種視頻處理方法。所述方法包括:
獲取待處理的視頻;
根據所述待處理的視頻,確定所述視頻中的關鍵幀,所述關鍵幀為所述視頻的多個圖像幀中的至少一個;
對所述關鍵幀的候選區域的內容進行識別,獲得所述關鍵幀的描述信息;
呈現所述關鍵幀的描述信息。
在一些可能的實現方式中,所述呈現所述關鍵幀的描述信息,包括:
在所述視頻的導航區域呈現所述關鍵幀的描述信息;或者,
在所述視頻的時間軸呈現所述關鍵幀的描述信息。
在一些可能的實現方式中,所述在所述視頻的時間軸呈現所述關鍵幀的描述信息,包括:
基于所述關鍵幀在所述視頻中的時間信息,與所述視頻的時間軸關聯展示所述關鍵幀的描述信息。
在一些可能的實現方式中,所述方法還包括:
響應于用戶針對所述關鍵幀的描述信息的觸發操作,將所述視頻定位至與所述關鍵幀的描述信息對應的時間點,以使所述視頻從所述時間點播放。
在一些可能的實現方式中,所述對所述關鍵幀的候選區域的內容進行識別,獲得所述關鍵幀的描述信息,包括:
通過光學字符識別OCR對所述關鍵幀的候選區域的內容進行識別,獲得所述候選區域的文字識別結果;
根據所述候選區域的文字識別結果,獲得所述關鍵幀的描述信息。
在一些可能的實現方式中,所述根據所述候選區域的文字識別結果,獲得所述關鍵幀的描述信息,包括:
根據設定的過濾條件,過濾所述候選區域的文字識別結果;
根據過濾后的文字識別結果,獲得所述關鍵幀的描述信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字跳網絡技術有限公司,未經北京字跳網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310615111.2/2.html,轉載請聲明來源鉆瓜專利網。





