[發(fā)明專利]一種由音頻和圖片組成的視頻文件的生成和檢索播放方法、裝置有效
| 申請?zhí)枺?/td> | 201710657600.9 | 申請日: | 2017-08-03 |
| 公開(公告)號: | CN107295284B | 公開(公告)日: | 2020-08-25 |
| 發(fā)明(設(shè)計)人: | 邵之江;張舵;張丁;王永銘 | 申請(專利權(quán))人: | 浙江大學(xué) |
| 主分類號: | H04N5/76 | 分類號: | H04N5/76;H04N21/81;G11B27/10 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 劉靜;邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 音頻 圖片 組成 視頻文件 生成 檢索 播放 方法 裝置 | ||
1.一種由音頻和圖片組成的視頻文件的生成方法,其特征在于,包括以下步驟:
S1、采集音頻,同時采集與音頻時間同步的圖片,圖片的采集方式具體為:自動觸發(fā)方式為自動檢測到場景轉(zhuǎn)換時拍照:用戶設(shè)置感興趣的區(qū)域和觸發(fā)拍照的閾值TH,按用戶設(shè)定的視頻幀率獲取圖像,從獲取的圖像中提取用戶設(shè)置的感興趣區(qū)域的圖像G,對G進行運動估計得到運動矢量,對運動矢量的長度進行加和,除以感興趣區(qū)域的圖像大小,得到運動速度的指標E;當(dāng)E大于TH時,將當(dāng)前圖像編碼為視頻流,否則,將載有上一幀信息的視頻幀拷貝并寫入到視頻流中進行編碼;
S2、將采集的圖片編碼為視頻流,將音頻編碼為音頻流;
S3、將視頻流與音頻流封裝生成視頻文件,所述視頻文件用于對嵌入了圖片后的音頻進行索引和連續(xù)播放。
2.根據(jù)權(quán)利要求1所述的由音頻和圖片組成的視頻文件的生成方法,其特征在于,所述步驟S2中,將要嵌入的圖片編碼為視頻流對應(yīng)時間點的I幀,視頻流中的其他幀不編碼為I幀。
3.根據(jù)權(quán)利要求2所述的由音頻和圖片組成的視頻文件的生成方法,其特征在于,I幀編碼圖片在視頻中保持靜止直到下一張圖片出現(xiàn)。
4.根據(jù)權(quán)利要求1所述的由音頻和圖片組成的視頻文件的生成方法,其特征在于,所述步驟S1中,手動觸發(fā)為用戶點擊按鈕觸發(fā):當(dāng)用戶點擊拍照按鈕時,記錄當(dāng)前時間,獲取一幀圖像,將該圖像編碼為視頻流;其他系統(tǒng)觸發(fā)為:通過遙控器紅外信號觸發(fā),當(dāng)接收到其他系統(tǒng)拍照請求時,獲取當(dāng)前圖像,將該圖像編碼為視頻流。
5.根據(jù)權(quán)利要求1所述的由音頻和圖片組成的視頻文件的生成方法,其特征在于,所述步驟S1中,采集音頻之前,還包括參數(shù)設(shè)置的步驟,設(shè)置的參數(shù)包括音頻錄制參數(shù)、圖片拍攝參數(shù)和視頻生成參數(shù);所述音頻錄制參數(shù)包括音頻碼率;所述圖片拍攝參數(shù)包括圖片大小和分辨率,所述視頻生成參數(shù)包括視頻幀率。
6.一種權(quán)利要求1-5任一項所述的由音頻和圖片組成的視頻文件的生成方法,其特征在于,生成的視頻文件的檢索播放方法包括:
用戶選取待播放的視頻文件;
從視頻文件中獲取視頻流并逐幀解碼;
讀取幀的類型,如果是關(guān)鍵幀,則將該幀圖像展示給用戶;關(guān)鍵幀出現(xiàn)的時間與圖片嵌入的時間點對應(yīng);
當(dāng)用戶選中某個要播放的幀后,直接跳到選中幀對應(yīng)的時間進行音頻播放。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述關(guān)鍵幀為I幀。
8.一種由音頻和圖片組成的視頻文件的生成裝置,其特征在于,該裝置包括:
音頻采集單元:采集音頻,將采集的音頻編碼為音頻流;
圖片采集單元:采集與音頻時間同步的圖片,將采集的圖片編碼為視頻流,圖片的采集方式具體為:自動觸發(fā)方式為自動檢測到場景轉(zhuǎn)換時拍照:用戶設(shè)置感興趣的區(qū)域和觸發(fā)拍照的閾值TH,按用戶設(shè)定的視頻幀率獲取圖像,從獲取的圖像中提取用戶設(shè)置的感興趣區(qū)域的圖像G,對G進行運動估計得到運動矢量,對運動矢量的長度進行加和,除以感興趣區(qū)域的圖像大小,得到運動速度的指標E;當(dāng)E大于TH時,將當(dāng)前圖像編碼為視頻流,否則,將載有上一幀信息的視頻幀拷貝并寫入到視頻流中進行編碼;
視頻文件生成單元:將視頻流與音頻流封裝生成視頻文件,所述視頻文件用于對嵌入了圖片后的音頻進行索引和連續(xù)播放。
9.一種權(quán)利要求8生成的視頻文件的檢索播放裝置,其特征在于,該裝置包括:
顯示單元,具有錄音檢索界面,該界面顯示視頻中所有關(guān)鍵幀圖像,當(dāng)用戶點擊某個關(guān)鍵幀圖像時,自動定位到該幀所在的錄音時間點,即用戶拍攝該圖像的錄音時間點播放音頻;
播放控制單元,對播放的音頻進行控制,包括開始播放按鈕、暫停播放按鈕以及播放進度條。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué),未經(jīng)浙江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710657600.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





