[發明專利]一種檢測字幕清晰度的方法及裝置有效
| 申請號: | 201711026446.1 | 申請日: | 2017-10-27 |
| 公開(公告)號: | CN107846622B | 公開(公告)日: | 2020-04-28 |
| 發明(設計)人: | 劉劍;馬哲 | 申請(專利權)人: | 北京雷石天地電子技術有限公司 |
| 主分類號: | H04N21/431 | 分類號: | H04N21/431;H04N21/488;H04N5/14;H04N21/44 |
| 代理公司: | 北京卓嵐智財知識產權代理事務所(特殊普通合伙) 11624 | 代理人: | 王新月 |
| 地址: | 100101 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 檢測 字幕 清晰度 方法 裝置 | ||
本發明實施例提供了一種檢測字幕清晰度的方法及裝置,該方法包括:獲取待識別字幕的視頻文件,解析得到所述視頻文件中各個幀的圖片,并將各個幀的圖片保存至與所述視頻文件對應的隊列中;通過OCR算法識別各個圖片中的字符串總長度與文字的總個數,分別計算各個圖片中字符串總長度與文字的總個數的第一比值;將各個第一比值與預定比值閾值進行比較,確定各個第一比值的權重值;確定各個第一比值的權重值中低于預定權重閾值的個數,計算所述個數與各個第一比值總個數的第二比值,根據計算出的所述第二比值判斷所述視頻文件字幕顯示效果是否合格。通過本發明,實現了快速、便捷地檢測出視頻文件中的字幕的清晰程度。
技術領域
本發明涉及計算機視頻技術領域,尤其涉及一種檢測字幕清晰度的方法及裝置。
背景技術
隨著計算機技術的發展,人們的生活也隨之越來越豐富多彩。當今社會中,人們通常將唱卡拉OK作為娛樂項目,由于歌曲種類繁多,人們在唱卡拉OK時,無法完整地記住各個歌曲的歌詞,唱歌的過程中往往需要參照MV(Music Video,音樂短片)視頻中的字幕才能順利的唱完一首歌曲,但是,由于各種因素,如硬件的顯卡驅動發生故障或軟件解碼器存在問題時,將導致歌曲視頻中的字幕無法正常顯示,因此,將對人們參照視頻中的字幕唱歌時造成極大的不便,影響用戶的唱歌體驗?,F有技術中,往往依靠人工肉眼識別MV視頻中的字幕是否顯示正常。
在實現本發明過程中,發明人發現現有技術中至少存在如下問題:人工肉眼識別MV視頻中的字幕的方式,效率極低,并且許多工作需要大量的重復,同時,由于人工肉眼的客觀因素,當肉眼進行大量識別工作后將導致眼睛疲勞,將無法避免地發生識別錯誤的情況。
因此,亟待一種高效、便捷的檢測方法來確定出視頻文件中的字幕是否正常顯示。
發明內容
本發明實施例提供一種檢測字幕清晰度的方法及裝置,實現了高效、快速地檢測出視頻文件中的字幕的顯示效果是否合格。
一方面,本發明實施例提供了一種檢測字幕清晰度的方法,包括:
獲取待識別字幕的視頻文件,解析得到所述視頻文件中各個幀的圖片,并將各個幀的圖片保存至與所述視頻文件對應的隊列中;
通過OCR算法識別各個圖片中的字符串總長度與文字的總個數,分別計算各個圖片中字符串總長度與文字的總個數的第一比值;
將各個第一比值與預定比值閾值進行比較,確定各個第一比值的權重值;
確定各個第一比值的權重值中低于預定權重閾值的個數,計算所述個數與各個第一比值總個數的第二比值,根據計算出的所述第二比值判斷所述視頻文件字幕顯示效果是否合格。
另一方面,本發明實施例提供了一種檢測字幕清晰度的裝置,包括:
獲取及保存單元,用于獲取待識別字幕的視頻文件,解析得到所述視頻文件中各個幀的圖片,并將各個幀的圖片保存至與所述視頻文件對應的隊列中;
識別及計算單元,用于通過OCR算法識別各個圖片中的字符串總長度與文字的總個數,分別計算各個圖片中字符串總長度與文字的總個數的第一比值;
比較及確定單元,用于將各個第一比值與預定比值閾值進行比較,確定各個第一比值的權重值;
計算及判斷單元,用于確定各個第一比值的權重值中低于預定權重閾值的個數,計算所述個數與各個第一比值總個數的第二比值,根據計算出的所述第二比值判斷所述視頻文件字幕顯示效果是否合格。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京雷石天地電子技術有限公司,未經北京雷石天地電子技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711026446.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:移動終端及其控制方法
- 下一篇:多模式支付系統和方法





