[發明專利]一種視頻字幕識別方法及系統有效
| 申請號: | 201610928665.8 | 申請日: | 2016-10-31 |
| 公開(公告)號: | CN106529529B | 公開(公告)日: | 2018-01-30 |
| 發明(設計)人: | 王星星 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32 |
| 代理公司: | 廣州三環專利商標代理有限公司44202 | 代理人: | 郝傳鑫,賈允 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 視頻 字幕 識別 方法 系統 | ||
技術領域
本發明涉及視頻技術領域,尤其涉及視頻字幕識別方法及系統。
背景技術
伴隨信息技術和通訊技術的不斷發展,大量廣播視頻信息不斷涌現,比如各類新聞報道、電視劇目、網絡視頻等,使得廣播電視視頻逐漸成為人們獲取日常信息的一種重要媒介。根據2014年國家統計局發布的數據顯示,截至2014年,我國廣播電視節目綜合人口覆蓋率已達到98.60%,成為世界上覆蓋人口最多、公眾信息傳送量最大,有線、無線、衛星等多種現代技術手段并用的廣播電視網絡。可以看出,面向三網融合的廣播電視新媒體的內容管理與分發,具有巨大的社會效益和商業價值。
廣播視頻中的字幕字符是一種高級語義信息,能夠為媒體內容管理與分發提供重要的輔助信息,若能將廣播電視新媒體的視頻字符準確識別出來,這將對分析視頻字幕了解視頻屬性具有重大意義。
目前在視頻字幕識別領域,通常是直接從視頻流里面解碼得到字幕信息,然后將得到的字幕直接與預設的字幕進行比對測試,測試對象單一;對提取出來的文本信息大都通過人眼比對的形式進行測試,采用人工方式進行識別率的計算,效率低下,且準確性得不到認可;對于不同字體大小、不同字體種類的識別效果的測試程序也非常麻煩;同時由于視頻字幕背景復雜,識別引擎難以全部有效識別,識別率很難提升。
發明內容
為了解決上述技術問題,本發明提出了視頻字幕識別方法及系統。
本發明是以如下技術方案實現的:
一種視頻字幕識別方法,包括:
將原始字幕文本中的字符渲染生成字幕圖片,將所述字幕圖片疊加至無字幕源視頻中,編碼生成字幕視頻;
從所述字幕視頻中提取出新的字幕文本,所述新的字幕文本為測試字幕文本;
比對所述字幕視頻中的字符與所述原始字幕文本,并輸出對應的識別率;
其中,所述字幕圖片為一種樣式或多種樣式,所述多種樣式為不同字號和/或不同字體的樣式,相同的樣式保存在相同的測試字幕文本中。
一種視頻字幕識別系統,包括:
視頻生成模塊,用于將原始字幕文本中的字符渲染生成字幕圖片,將所述字幕圖片疊加至無字幕源視頻中,編碼生成字幕視頻;
字幕提取模塊,用于從所述字幕視頻中提取出新的字幕文本,所述新的字幕文本為測試字幕文本;
文本對比模塊,用于比對所述測試字幕文本與原始字幕文本,并輸出對應的識別率;
其中,所述字幕圖片為一種樣式或多種樣式,所述多種樣式為不同字號和/或不同字體的樣式,相同的樣式保存在相同的測試字幕文本中。
本發明提供的視頻字幕識別方法及系統,有益效果是:能夠對原始字幕文本進行渲染,提取出一種或多種不同樣式字幕作為測試對象,測試范圍廣;通過算法自動比對測試字幕文本與原始字幕文本,識別效率明顯得到提升。
附圖說明
為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
圖1是實施例一提供的視頻字幕識別方法的流程圖;
圖2是實施例一中的字號為28、字體為黑體的字幕視頻圖像;
圖3是實施例一中的字號為32、字體為黑體的字幕視頻圖像;
圖4是實施例一中的字號為28、字體為簡準圓的字幕視頻圖像;
圖5是實施例一中的字號為32、字體為簡準圓的字幕視頻圖像;
圖6是實施例二提供的視頻字幕識別方法的流程圖;
圖7是實施例二提供的對錯誤字符進行判斷的流程圖;
圖8是實施例三提供的視頻字幕識別方法的流程圖;
圖9是實施例四提供的視頻字幕識別系統的結構框圖;
圖10是實施例五提供的視頻字幕識別系統的結構框圖。
具體實施方式
為了使本技術領域的人員更好地理解本發明方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分的實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本發明保護的范圍。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610928665.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種具有多功能的室內花草種植管理系統
- 下一篇:有機蔬菜穴盤育苗基質





