[發明專利]一種快速編碼廣播用數字音頻的方法有效

申請號：	201811124426.2	申請日：	2018-09-26
公開（公告）號：	CN109243471B	公開（公告）日：	2022-09-23
發明（設計）人：	陳永澤;呂連新;趙凡	申請（專利權）人：	杭州聯匯科技股份有限公司
主分類號：	G10L19/008	分類號：	G10L19/008;G10L19/16;G06F9/50
代理公司：	杭州知見專利代理有限公司 33295	代理人：	盧金元
地址：	310052 浙江省杭州市濱***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種快速編碼廣播數字音頻方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種快速編碼廣播用數字音頻的方法，其包括以下步驟：S1、把源音頻文件轉換為PCM數據；S2、將PCM數據切分成若干塊，并給每塊數據按先后順序打上標簽；S3、將切分后的數據送入CPU或GPU進行并行編碼運算；S4、將編碼完成的音頻數據按標簽順序進行合并，生成最終的數字音頻文件。本方案將數據切分以后送入處理器并行處理，在當前處理器基本為多核處理器的情況下，可以每個核心處理一塊數據，多線程并發，有效提高處理速度。本方案適用于廣播等場合使用的大音頻數據文件編解碼處理。

技術領域

本發明涉及數字音頻編解碼技術領域，尤其是涉及一種可以并行處理的快速編碼廣播用數字音頻的方法。

背景技術

廣播用音頻數據文件需要進行編解碼操作，當音頻文件較大時，例如24小時音頻，則編解碼過程耗時較長，處理器利用率不高。

發明內容

本發明主要是解決現有技術所存在的音頻文件編碼耗時較長、效率較低的技術問題，提供一種可以充分利用多核CPU或GPU、具有較高處理器利用率的快速編碼廣播用數字音頻的方法。

本發明針對上述技術問題主要是通過下述技術方案得以解決的：一種快速編碼廣播用數字音頻的方法，包括以下步驟：

S1、把源音頻文件轉換為PCM數據；

S2、將PCM數據切分成若干塊，并給每塊數據按先后順序打上標簽；

S3、將切分后的數據送入CPU或GPU進行并行編碼運算；

S4、將編碼完成的音頻數據按標簽順序進行合并，生成最終的數字音頻文件。

本方案將數據切分以后送入處理器并行處理，在當前處理器基本為多核處理器的情況下，可以每個核心處理一塊數據，多線程并發，有效提高處理速度。

作為優選，所述步驟S1具體為：

S101、判斷源音頻是否為PCM數據，如果是，則跳轉到步驟S103，否則進入步驟S102：

S102、對源音頻數據解碼生成PCM數據，然后進入步驟S103；

S103、判斷PCM數據與目標音頻MP2的采樣率、位深度和聲道數量是否一致，如果其中任一參數不一致則進入步驟S104，如果所有參數均一致則進入步驟S2；目標音頻MP2的采樣率、位深度、聲道數量，是編碼前人為或程序默認輸入的參數；

S104、對源數據進行重采樣和重量化，然后進入步驟S2。重采樣和重量化后的數據即為PCM數據，不需要解碼操作。

作為優選，步驟S1中，源音頻為可以用ffmpeg或libav開源庫完成通用解碼，生成PCM數據的音頻數據。

作為優選，每塊數據的大小S_chunk由以下公式組確定：

式中，P為幀填充的最小周期值，C_f為單位幀所含樣本信息的數量，N_bitdepth為位深，N_channel為聲道數量，Ceil(float)為向上取整函數，S_pcm為PCM數據總大小，S_frame為單位幀數據大小。C_f：對于MP1每幀固定為384個樣點信息，對于MP2每幀固定為1152個樣點信息。N_bitdepth：位深為編碼前人為或程序默認輸入的參數，一般默認為16bit。N_channel：聲道數為編碼前認為或程序默認輸入的參數，一般為立體聲，即2個聲道。

作為優選，幀填充的最小周期值P由以下公式組確定：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于杭州聯匯科技股份有限公司，未經杭州聯匯科技股份有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201811124426.2/2.html，轉載請聲明來源鉆瓜專利網。