[發明專利]多媒體視音頻流唇音同步的調測方法有效
| 申請號: | 200610170273.6 | 申請日: | 2006-12-26 |
| 公開(公告)號: | CN101212690A | 公開(公告)日: | 2008-07-02 |
| 發明(設計)人: | 薛堯舜;張學英 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | H04N7/62 | 分類號: | H04N7/62;H04N7/60 |
| 代理公司: | 北京中博世達專利商標代理有限公司 | 代理人: | 申健 |
| 地址: | 518057廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 多媒體 音頻 唇音 同步 方法 | ||
1.一種多媒體視音頻流唇音同步的調測方法,包括如下步驟:
(1)在多媒體視音頻流解碼端真實時鐘的基礎上建立虛擬時鐘模型;
(2)根據自適應延遲算法和同步控制算法的計算結果,調整所述虛擬時鐘,獲得多媒體視音頻流唇音同步。
2.根據權利要求1所述的多媒體視音頻流唇音同步的調測方法,其特征在于,所述步驟(1)中建立虛擬時鐘模型的方法為:
(11)設置虛擬時鐘的初始值為收到的多媒體流的第一個媒體數據單元的時戳;
(12)獲取每一個抵達的媒體數據單元的生成時間和抵達時間;
(13)解碼端將所述每一個抵達的媒體數據單元的生成時間作為其回放時間,將每一個抵達的媒體數據單元的抵達時間作為虛擬時鐘采樣,比較所述生成時間和抵達時間并重新調度回放時間,獲得自適應的回放期限。
3.根據權利要求2所述的多媒體視音頻流唇音同步的調測方法,其特征在于,所述步驟(2)中,自適應延遲算法包括:
(21)計算媒體流內的同步相位扭曲;
所述媒體流內的同步相位扭曲通過計算流內的媒體數據單元的回放時間以及采樣時間的均方根誤差來獲得,計算公式如下:
其中,Tgi(n)為流i的第n個媒體數據單元的生成時間,Tpi(n)為流i的第n個媒體數據單元的播放的時間,Ni是流i的被播放的所有媒體數據單元的數量;
(22)計算媒體流間的同步相位扭曲;
所述媒體流間的同步相位扭曲通過計算最近的相應流間媒體數據單元的回放時間以及采樣時間的均方根誤差來獲得,計算公式如下:
其中,音頻的第m個媒體數據單元對應于視頻的第n個媒體數據單元,Tga(m)為音頻的第m個媒體數據單元的生成時間,Tpa(m)為音頻的第m個媒體數據單元的播放時間;Tgv(n)為視頻的第n個媒體數據單元的生成時間,Tpv(n)為視頻的第n個媒體數據單元的播放時間,Na是所有音頻媒體數據單元的數量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200610170273.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半步踏墊
- 下一篇:橋梁主塔橫梁頂鋼箱梁節段的安裝方法





