[發明專利]獲取MV視頻資源中字幕信息的方法及系統有效
| 申請號: | 201510351335.2 | 申請日: | 2015-06-23 |
| 公開(公告)號: | CN107027067B | 公開(公告)日: | 2020-02-07 |
| 發明(設計)人: | 鄧宏平;劉青;吳愛紅;張銀田;魏征;吳子揚;常歡;魏思;胡郁;劉慶峰 | 申請(專利權)人: | 訊飛智元信息科技有限公司 |
| 主分類號: | H04N21/431 | 分類號: | H04N21/431;H04N21/435 |
| 代理公司: | 11252 北京維澳專利代理有限公司 | 代理人: | 劉路堯;逢京喜 |
| 地址: | 230088 安徽省合肥市高*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 獲取 mv 視頻 資源 字幕 信息 方法 系統 | ||
本發明公開了一種獲取MV視頻資源中字幕信息的方法及系統,該方法包括:獲取MV視頻資源;根據所述MV視頻資源中的視頻幀圖像確定所述MV視頻資源中的字幕空間位置;根據所述字幕的空間位置確定的上下邊界之間的圖像確定所述字幕的時間位置;依次計算每個時間位置內的字幕條的時間線。本發明可以實現對唱評資源中字幕信息的自動采集,并提高唱評資源的準確性。
技術領域
本發明涉及信息采集技術領域,具體涉及一種獲取MV視頻資源中字幕信息的方法及系統。
背景技術
隨著科技的不斷發展,以及人們生活水平的不斷提高,人們的休閑娛樂生活越來越豐富,比如參加各種歌唱比賽以及去KTV唱歌已日益普遍,因而唱歌的打分和評測需求就相應而生。目前主流的唱歌打分系統,是通過對音高、節奏和歌詞三方面的信息進行評測。因此,儲備數量足夠多、質量足夠好的評測資源,成為該系統體驗好壞的直接決定性因素。
考慮到成本與版權的問題,目前唱評資源的制作主要通過以下兩種方式:
1.人工標注方式:由有一定音樂基礎的人,對歌曲的歌詞進行校對、補充,并通過聽取音頻文件,標注歌曲歌唱的音高、音長,從而實現唱評資源的標注工作。
2.樂器彈奏方式:由音樂造詣較高的人,對利用樂器歌曲進行彈奏,然后利用特制的軟件進行錄制,從而得到歌曲的音高、音長信息,再結合現有歌詞的信息,完成唱評資源的標注。
現有的基于人工標注的方法,不僅效率低,成本高,而且標注過程中也會受到標注人員疲憊疏忽而造成的錯誤標注的困擾。而基于樂器彈奏的方法,同樣需要人工參與,彈奏人員的技術熟練程度也會影響標注結果;對于大規模的標注任務,彈奏人員受到的壓力同樣不小;此外,如果彈奏的節奏與MV視頻中的節奏不能完全吻合,就會影響最終的唱歌打分。因而采用傳統的唱評資源采集方法,難以實現大規模的唱評資源采集。
發明內容
本發明實施例提供一種獲取MV視頻資源中字幕信息的方法及系統,以實現對唱評資源中字幕信息的自動采集,并提高唱評資源的準確性。
為此,本發明實施例提供如下技術方案:
一種獲取MV視頻資源中字幕信息的方法,包括:
獲取MV視頻資源;
根據所述MV視頻資源中的視頻幀圖像確定所述MV視頻資源中的字幕空間位置;
根據所述字幕的空間位置確定的上下邊界之間的圖像確定所述字幕的時間位置;
依次計算每個時間位置內的字幕條的時間線。
優選地,所述根據所述MV視頻資源中的視頻幀圖像確定所述MV視頻資源中的字幕空間位置包括:
對所述MV視頻資源進行灰度處理,得到各視頻幀圖像的灰度圖;
利用所述灰度圖計算所述視頻幀圖像的梯度特征;
根據所述視頻幀圖像的梯度特征得到只含字幕區域像素的視頻幀圖像;
對所述只含字幕區域像素的視頻幀圖像做投影處理,并利用投影曲線計算得到字幕條的上下邊界。
優選地,所述根據所述視頻幀圖像的梯度特征得到只含字幕區域像素的視頻幀圖像包括:
根據所述視頻幀圖像的梯度特征考察多個連續的視頻幀圖像內的候選梯度點,所述候選梯度點是指梯度幅值大于設定的幅度閾值的梯度點;
如果當前視頻幀圖像中的每個候選梯度點的設定鄰域內,對應在前一視頻幀圖像中也存在一個候選梯度點,則確定所述候選梯度點為穩定梯度點;
獲取只含穩定梯度點的視頻幀圖像;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于訊飛智元信息科技有限公司,未經訊飛智元信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510351335.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:反相器電路
- 下一篇:電路裝置、振蕩器、電子設備以及移動體





