[發明專利]音畫同步判斷方法、裝置、終端及計算機可讀存儲介質有效
| 申請號: | 201911311808.0 | 申請日: | 2019-12-18 |
| 公開(公告)號: | CN111093108B | 公開(公告)日: | 2021-12-03 |
| 發明(設計)人: | 梁衍鵬 | 申請(專利權)人: | 廣州酷狗計算機科技有限公司 |
| 主分類號: | H04N21/43 | 分類號: | H04N21/43;H04N21/8547;G06F16/432;G06F16/48 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 郭新禹 |
| 地址: | 510660 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音畫 同步 判斷 方法 裝置 終端 計算機 可讀 存儲 介質 | ||
本公開提供了一種音畫同步判斷方法、裝置、終端及計算機可讀存儲介質,屬于音視頻處理技術領域。所述方法包括:獲取從服務器接收到的第一多媒體數據的目標視頻幀對應的第一音頻數據,確定第一音頻數據的第一指紋信息,將第一指紋信息與至少一個第二指紋信息進行比較,若第一指紋信息與任一個第二指紋信息相同,則確定第一多媒體數據音畫同步。由于指紋具有唯一性,可以作為音頻數據的標識,通過上述方法,提取音頻數據的指紋,并根據指紋來對音畫同步進行判斷,無需人工觀察,可以提高音畫同步判斷效率,而且可以避免人工判斷帶來的誤差,提高判定正確率。
技術領域
本公開涉及音視頻處理技術領域,特別涉及一種音畫同步判斷方法、裝置、終端及計算機可讀存儲介質。
背景技術
隨著計算機技術的不斷發展,依托于計算機的休閑娛樂行業也蓬勃發展,直播行業越來越被普通大眾所認知,從最開始的游戲直播,到娛樂直播、戶外直播等,揭開了直播門類的大幕。在一場音視頻直播過程中,聲音播放和畫面顯示的同步,也即是,音畫同步,是非常重要的,如果出現聲音與畫面不同步的異常情況,會嚴重影響用戶體驗,觀眾可能會誤以為主播是在假唱,給主播的聲譽造成嚴重影響。目前對聲音與畫面是否同步進行判斷,主要是通過人工方法來進行判斷的,由人工根據播放的聲音和畫面,自行對聲音與畫面是否同步進行判斷,由于人工判斷需要一定時間來進行觀察,導致音畫同步的判斷效率低,而且,依靠人工進行判斷存在很大的主觀性,很容易導致判斷出現誤差,音畫同步的判斷正確率低。
發明內容
本公開實施例提供了一種音畫同步判斷方法、裝置、終端及計算機可讀存儲介質,可以解決相關技術中音畫同步的判斷效率低、判斷正確率低的問題。
該技術方案如下:
一方面,提供了一種音畫同步判斷方法,該方法包括:
基于從服務器接收到的第一多媒體數據,獲取該第一多媒體數據中目標視頻幀對應的第一音頻數據;
基于該第一音頻數據,確定該第一音頻數據的第一指紋信息;
將該第一指紋信息與至少一個第二指紋信息進行比較,一個第二指紋信息用于表示該服務器所接收到第二多媒體數據中該目標視頻幀對應的第二音頻數據,該第二多媒體數據與該第一多媒體數據對應于同一在線播放過程;
若該第一指紋信息與任一個該第二指紋信息相同,則確定該第一多媒體數據音畫同步。
在一種可能的實現方式中,該將該第一指紋信息與至少一個第二指紋信息進行比較之前,該方法還包括:
獲取承載該目標視頻幀的報文,從獲取到的報文中,獲取至少一個第二指紋信息。
在一種可能的實現方式中,該至少一個第二指紋信息包括:
該第二多媒體數據中與該目標視頻幀具有相同時間戳的第二音頻數據的指紋信息,以及,該第二多媒體數據中與該目標視頻幀的時間戳間隔小于目標時長的第二音頻數據的指紋信息。
在一種可能的實現方式中,該基于該第一音頻數據,確定該第一音頻數據的第一指紋信息之前,該方法還包括:
對該第一音頻數據進行降采樣處理。
在一種可能的實現方式中,該將該第一指紋信息與至少一個第二指紋信息進行比較之后,該方法還包括:
若該第一指紋信息與該至少一個第二指紋信息均不相同,則確定該第一多媒體數據音畫不同步。
一方面,提供了一種音畫同步判斷方法,該方法包括:
在在線播放過程中,獲取第二多媒體數據中目標視頻幀對應的至少一個第二音頻數據;
基于該至少一個第二音頻數據,確定至少一個第二指紋信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州酷狗計算機科技有限公司,未經廣州酷狗計算機科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911311808.0/2.html,轉載請聲明來源鉆瓜專利網。





