[發明專利]一種快速編碼廣播用數字音頻的方法有效
| 申請號: | 201811124426.2 | 申請日: | 2018-09-26 |
| 公開(公告)號: | CN109243471B | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 陳永澤;呂連新;趙凡 | 申請(專利權)人: | 杭州聯匯科技股份有限公司 |
| 主分類號: | G10L19/008 | 分類號: | G10L19/008;G10L19/16;G06F9/50 |
| 代理公司: | 杭州知見專利代理有限公司 33295 | 代理人: | 盧金元 |
| 地址: | 310052 浙江省杭州市濱*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 快速 編碼 廣播 數字音頻 方法 | ||
本發明公開了一種快速編碼廣播用數字音頻的方法,其包括以下步驟:S1、把源音頻文件轉換為PCM數據;S2、將PCM數據切分成若干塊,并給每塊數據按先后順序打上標簽;S3、將切分后的數據送入CPU或GPU進行并行編碼運算;S4、將編碼完成的音頻數據按標簽順序進行合并,生成最終的數字音頻文件。本方案將數據切分以后送入處理器并行處理,在當前處理器基本為多核處理器的情況下,可以每個核心處理一塊數據,多線程并發,有效提高處理速度。本方案適用于廣播等場合使用的大音頻數據文件編解碼處理。
技術領域
本發明涉及數字音頻編解碼技術領域,尤其是涉及一種可以并行處理的快速編碼廣播用數字音頻的方法。
背景技術
廣播用音頻數據文件需要進行編解碼操作,當音頻文件較大時,例如24小時音頻,則編解碼過程耗時較長,處理器利用率不高。
發明內容
本發明主要是解決現有技術所存在的音頻文件編碼耗時較長、效率較低的技術問題,提供一種可以充分利用多核CPU或GPU、具有較高處理器利用率的快速編碼廣播用數字音頻的方法。
本發明針對上述技術問題主要是通過下述技術方案得以解決的:一種快速編碼廣播用數字音頻的方法,包括以下步驟:
S1、把源音頻文件轉換為PCM數據;
S2、將PCM數據切分成若干塊,并給每塊數據按先后順序打上標簽;
S3、將切分后的數據送入CPU或GPU進行并行編碼運算;
S4、將編碼完成的音頻數據按標簽順序進行合并,生成最終的數字音頻文件。
本方案將數據切分以后送入處理器并行處理,在當前處理器基本為多核處理器的情況下,可以每個核心處理一塊數據,多線程并發,有效提高處理速度。
作為優選,所述步驟S1具體為:
S101、判斷源音頻是否為PCM數據,如果是,則跳轉到步驟S103,否則進入步驟S102:
S102、對源音頻數據解碼生成PCM數據,然后進入步驟S103;
S103、判斷PCM數據與目標音頻MP2的采樣率、位深度和聲道數量是否一致,如果其中任一參數不一致則進入步驟S104,如果所有參數均一致則進入步驟S2;目標音頻MP2的采樣率、位深度、聲道數量,是編碼前人為或程序默認輸入的參數;
S104、對源數據進行重采樣和重量化,然后進入步驟S2。重采樣和重量化后的數據即為PCM數據,不需要解碼操作。
作為優選,步驟S1中,源音頻為可以用ffmpeg或libav開源庫完成通用解碼,生成PCM數據的音頻數據。
作為優選,每塊數據的大小Schunk由以下公式組確定:
式中,P為幀填充的最小周期值,Cf為單位幀所含樣本信息的數量,Nbitdepth為位深,Nchannel為聲道數量,Ceil(float)為向上取整函數,Spcm為PCM數據總大小,Sframe為單位幀數據大小。Cf:對于MP1每幀固定為384個樣點信息,對于MP2每幀固定為1152個樣點信息。Nbitdepth:位深為編碼前人為或程序默認輸入的參數,一般默認為16bit。Nchannel:聲道數為編碼前認為或程序默認輸入的參數,一般為立體聲,即2個聲道。
作為優選,幀填充的最小周期值P由以下公式組確定:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于杭州聯匯科技股份有限公司,未經杭州聯匯科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811124426.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于音頻技術的肉雞咳嗽監測方法
- 下一篇:一種音頻處理方法及音頻處理系統





