[發明專利]多路音頻的壓縮與解壓縮方法及系統有效

申請號：	201911066528.8	申請日：	2019-11-04
公開（公告）號：	CN110808054B	公開（公告）日：	2022-05-06
發明（設計）人：	陳福松	申請（專利權）人：	思必馳科技股份有限公司
主分類號：	G10L19/008	分類號：	G10L19/008;G10L19/16;H04S3/00
代理公司：	北京商專永信知識產權代理事務所(普通合伙) 11400	代理人：	黃謙;車江華
地址：	215123 江蘇省蘇州市蘇***	國省代碼：	江蘇;32
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻壓縮解壓縮方法系統
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例提供一種多路音頻的壓縮與解壓縮方法。該方法包括：接收多路音頻文件，確定多路音頻文件的音頻頻率、聲道數量和各聲道的排列順序；將多路音頻文件按照聲道數量進行拆分，對拆分后的各聲道音頻按照音頻頻率進行分幀，并分別輸入至speex壓縮引擎進行壓縮，得到每一路音頻各自的ogg壓縮包；對每一路音頻各自的ogg壓縮包按照各聲道的排列順序進行交替存儲，生成多路音頻的壓縮文件。本發明實施例還提供一種多路音頻的壓縮與解壓縮系統。本發明實施例在壓縮過程中，按照聲道的順序進行交替存儲，為解碼過程進行鋪墊，解碼時可以多聲道并行解碼，減小多路音頻傳輸中的延遲，降低物聯網設備對于網絡帶寬的需求和傳輸數據導致的延遲的問題。

技術領域

本發明涉及云端多路語音識別領域，尤其涉及一種多路音頻的壓縮與解壓縮方法及系統。

背景技術

為適應當前多路識別的需求，通常會用到音頻壓縮與解壓縮技術，來降低物聯網設備對于網絡帶寬的需求以及傳輸數據導致的延遲。

在實現本發明過程中，發明人發現相關技術中至少存在如下問題：

普通壓縮由于延遲大，壓縮比較差的問題，不適用做實時性要求較高的音頻解碼。

Opus多路編解碼的缺點在于他將非48k的音頻重采樣成48k的音頻進行編解碼，這樣在編碼和解碼時都有重采樣，音頻失真導致可能會導致識別性能下降。

這些壓縮算法都是按照立體聲標準進行壓縮，包括信號處理，導致壓縮后的音頻與原始音頻差距較大，另外還有立體聲的聲道排列順序與原始聲道順序不一致的情況。

發明內容

為了至少解決現有技術中多路音頻在傳輸中壓縮較差，效率較低，導致傳輸延遲大，以及由于立體聲的聲道排列順序解壓前后不一致使得解壓后的音頻與原始音頻差距較大的問題。

第一方面，本發明實施例提供一種多路音頻的壓縮方法，包括：

接收多路音頻文件，確定所述多路音頻文件的音頻頻率、聲道數量，以及各聲道的排列順序；