[發明專利]音視頻處理方法、合成方法、裝置、電子設備及存儲介質有效
| 申請號: | 201910713206.1 | 申請日: | 2019-08-02 |
| 公開(公告)號: | CN111179970B | 公開(公告)日: | 2023-10-20 |
| 發明(設計)人: | 王勝 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L25/57 | 分類號: | G10L25/57;H04N5/92;H04N5/265 |
| 代理公司: | 深圳市聯鼎知識產權代理有限公司 44232 | 代理人: | 劉抗美 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 視頻 處理 方法 合成 裝置 電子設備 存儲 介質 | ||
本發明公開了一種音視頻處理方法、合成方法、裝置、電子設備及存儲介質,所述音視頻處理方法包括:獲取待處理音頻數據,所述待處理音頻數據是麥克風對揚聲器輸出的攜帶有第一特定音頻數據的源音頻數據進行采集生成的;確定所述待處理音頻數據中第二特定音頻數據的位置,所述第二特定音頻數據為攜帶背景噪聲的第一特定音頻數據;基于所述第二特定音頻數據在所述待處理音頻數據中的位置,從所述待處理音頻數據中將所述第二特定音頻數據和延遲音頻數據移除,得到目標音頻。采用本發明所提供的音視頻處理方法、合成方法、裝置、電子設備及存儲介質解決了現有技術中短視頻多段錄制過程中音視頻合成時的背景音樂不連續的問題。
技術領域
本發明涉及計算機技術領域,尤其涉及一種音視頻處理方法、合成方法、裝置、電子設備及存儲介質。
背景技術
短視頻多段錄制,就是用戶分別錄制多段不同的短視頻,然后合成為完整視頻,同時,用戶還可以根據應用場景的實際需要,為不同的短視頻配置對應的音頻數據,以在多段短視頻合成為完整視頻時能夠作為背景音樂添加至該完整視頻,以此增強該完整視頻的實用性、趣味性等等。
然而,發明人意識到,在短視頻多段錄制過程中,由于不同短視頻之間的錄制,往往存在暫停,由此引入延遲,而導致合成完整視頻時添加的背景音樂存在不連續。
由上可知,短視頻多段錄制過程中音視頻合成時的背景音樂不連續的問題仍有待解決。
發明內容
為了解決相關技術中存在的短視頻多段錄制過程中音視頻合成時的背景音樂不連續的問題,本發明各實施例提供一種音視頻處理方法、合成方法、裝置、電子設備及存儲介質。
其中,本發明所采用的技術方案為:
根據本發明實施例的一方面,一種音視頻處理方法,包括:獲取待處理音頻數據,所述待處理音頻數據是麥克風對揚聲器輸出的攜帶有第一特定音頻數據的源音頻數據進行采集生成的;確定所述待處理音頻數據中第二特定音頻數據的位置,所述第二特定音頻數據為攜帶背景噪聲的第一特定音頻數據;基于所述第二特定音頻數據在所述待處理音頻數據中的位置,從所述待處理音頻數據中將所述第二特定音頻數據和延遲音頻數據移除,得到目標音頻。
根據本發明實施例的一方面,一種音視頻合成方法,包括:在進行短視頻多段錄制過程中,針對為分別配置給多段短視頻的源音頻數據,獲取多個待處理音頻數據,每一個待處理音頻數據對應一段短視頻,所述待處理音頻數據是麥克風對揚聲器輸出的攜帶有第一特定音頻數據的源音頻數據進行采集生成的;針對每一個待處理音頻數據,確定該待處理音頻數據中第二特定音頻數據的位置,所述第二特定音頻數據為攜帶背景噪聲的第一特定音頻數據;基于所述第二特定音頻數據在該待處理音頻數據中的位置,從該待處理音頻數據中將所述第二特定音頻數據和延遲音頻數據移除,得到對應于短視頻的目標音頻;根據對應于不同短視頻的多個目標音頻和錄制得到的多段短視頻,合成完整視頻。
根據本發明實施例的一方面,一種音視頻處理裝置,包括:數據獲取模塊,用于獲取待處理音頻數據,所述待處理音頻數據是麥克風對揚聲器輸出的攜帶有第一特定音頻數據的源音頻數據進行采集生成的;位置確定模塊,用于確定所述待處理音頻數據中第二特定音頻數據的位置,所述第二特定音頻數據為攜帶背景噪聲的第一特定音頻數據;數據移除模塊,用于基于所述第二特定音頻數據在所述待處理音頻數據中的位置,從所述待處理音頻數據中將所述第二特定音頻數據和延遲音頻數據移除,得到目標音頻。
在一示例性實施例,所述裝置還包括:數據生成模塊,用于生成所述第一特定音頻數據;數據拼接模塊,用于獲取所述源音頻數據,并將所述源音頻數據與所述第一特定音頻數據進行拼接,得到拼接音頻數據;數據采集模塊,用于控制所述揚聲器輸出所述拼接音頻數據,并控制所述麥克風進行采集,生成所述待處理音頻數據。
在一示例性實施例,所述數據獲取模塊包括:錄制單元,用于進行語音段錄制,得到所述第一特定音頻數據;或,選取單元,用于從音頻庫中選取一段音頻數據作為所述第一特定音頻數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910713206.1/2.html,轉載請聲明來源鉆瓜專利網。





