[發明專利]一種視頻信息提取方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202211645972.7 | 申請日: | 2022-12-20 |
| 公開(公告)號: | CN115880612A | 公開(公告)日: | 2023-03-31 |
| 發明(設計)人: | 肖金輝;周多友;黃凱 | 申請(專利權)人: | 北京閃星科技有限公司 |
| 主分類號: | G06V20/40 | 分類號: | G06V20/40;G06V10/75 |
| 代理公司: | 北京中知法苑知識產權代理有限公司 11226 | 代理人: | 李明 |
| 地址: | 100098 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 信息 提取 方法 裝置 計算機 設備 存儲 介質 | ||
本公開提供了一種視頻信息提取方法、裝置、計算機設備和存儲介質,其中,該方法包括:根據目標視頻的各視頻幀中的初始文本行的文本行內容,對初始文本行進行聚類得到多個第一文本行簇;利用所述初始文本行的文本行高度區間和文本行傾斜角度,從所述多個第一文本行簇中篩選出第二文本行簇;根據各個所述第二文本行簇中的所述初始文本行的文本行高度區間,確定待提取的前景文本信息對應的標準文本高度區間;基于各所述視頻幀中的初始文本行的文本行高度區間和所述標準文本高度區間,從所述目標視頻中提取出目標文本信息。
技術領域
本公開涉及計算機技術領域,具體而言,涉及一種視頻信息提取方法、裝置、計算機設備和存儲介質。
背景技術
在各類視頻中,為了更好地幫助用戶閱讀和了解視頻內容,通常會采用在視頻中添加前景文本信息的方式。例如,在視頻中添加字幕信息、標題信息等。為了保證視頻整體內容的色彩和樣式協調性,通常需要保證視頻中的背景文本信息與前景文本信息之間不具備較大的文本形態差異,以避免前后景文本信息反差過大,而影響用戶觀看體驗。
但是,由于視頻中的背景文本信息與前景文本信息的文本形態差異不大,所以如何避免背景文本信息對前景文本信息的影響,將視頻中的前景文本信息準確提取出來,成為了一個技術難點。
發明內容
本公開實施例至少提供一種視頻信息提取方法、裝置、計算機設備和存儲介質。
第一方面,本公開實施例提供了一種視頻信息提取方法,包括:
根據目標視頻的各視頻幀中的初始文本行的文本行內容,對初始文本行進行聚類得到多個第一文本行簇;
利用所述初始文本行的文本行高度區間和文本行傾斜角度,從所述多個第一文本行簇中篩選出第二文本行簇;
根據各個所述第二文本行簇中的所述初始文本行的文本行高度區間,確定待提取的前景文本信息對應的標準文本高度區間;
基于各所述視頻幀中的初始文本行的文本行高度區間和所述標準文本高度區間,從所述目標視頻中提取出目標文本信息。
在一種可能的實施方式中,所述根據各個所述第二文本行簇中的所述初始文本行的文本行高度區間,確定待提取的前景文本信息對應的標準文本高度區間,包括:
根據各個所述第二文本行簇中的所述初始文本行的文本行高度區間,對所述第二文本行簇中的所述初始文本行進行聚類,得到多個第三文本行簇;其中,一個第三文本行簇對應于一個文本行高度區間;
基于每個所述第三文本行簇中的各個所述初始文本行的文本行內容之間的文本相似度,確定每個所述第三文本行簇對應的文本行重復度;
利用每個所述第三文本行簇對應的文本行重復度,從所述第三文本行簇中確定出目標文本行簇,并將所述目標文本行簇對應的文本行高度區間作為所述標準文本高度區間。
在一種可能的實施方式中,所述利用每個所述第三文本行簇對應的文本行重復度,從所述第三文本行簇中確定出目標文本行簇,包括:
按照文本行重復度從低到高的順序,對各個所述第三文本行簇進行排序,確定各個所述第三文本行簇的排序次序;
從所述第三文本行簇中篩選出排序次序小于預設次序的多個第四文本行簇;
根據每個所述第四文本行簇,確定所述目標文本行簇。
在一種可能的實施方式中,所述根據每個所述第四文本行簇,確定所述目標文本行簇,包括:
針對每個所述第四文本行簇,根據該第四文本行簇中的各個初始文本行包括的字符,確定該第四文本行簇對應的字符重復度;
從所述第四文本行簇中,選取對應的字符重復度最低的中間文本行簇;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京閃星科技有限公司,未經北京閃星科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211645972.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種PACK級消防方法及結構
- 下一篇:一種自動捕捉裝置及控制方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





