[發明專利]一種結合碼率分層和質量分層的音頻編碼量化控制的方法有效

申請號：	202011105481.4	申請日：	2020-10-15
公開（公告）號：	CN112420059B	公開（公告）日：	2022-04-19
發明（設計）人：	梅元剛;劉宇新;朱政	申請（專利權）人：	杭州微幀信息科技有限公司
主分類號：	G10L19/00	分類號：	G10L19/00
代理公司：	暫無信息	代理人：	暫無信息
地址：	310012 浙江省杭***	國省代碼：	浙江;33
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種結合分層質量音頻編碼量化控制方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明公開了一種結合碼率分層和質量分層的音頻編碼量化控制的方法，屬于音頻編碼領域。所述方法包括以下步驟：首先根據預測的質量控制因子acrf和初始的碼率分層對音頻進行預編碼；然后根據編碼結果調整碼率，使BDrate（表征碼率消耗和質量提升的對應關系）在該碼率下達到最高，在區間內相對質量最好，并且得到質量控制因子和碼率之間合理的線性映射方式，既能均衡質量又能對應質量調節碼率。

技術領域

本發明涉及音頻編碼技術領域，尤其涉及一種結合碼率分層和質量分層的音頻編碼量化控制的方法。

背景技術

音頻編碼的主要目的是在保證一定主觀聽覺質量的前提下，最大程度地去除輸入信號的統計冗余和感知冗余來實現數據量的壓縮，以滿足不同傳輸和存儲條件下的需求。

在以下場景中，人們對音頻碼率有分層控制的需求，希望在不同條件下適用不同的碼率，并且盡量保持每一條件下的音頻質量。

1）對音頻內容進行瘦身及按質量分檔進行存儲，以節約存儲空間并盡量保持音頻質量。

2）在面對在線語音交互方面：

- 包括實時通訊、直播、移動端點播、大型音頻服務系統在線語音轉發等場景；

- 需要既節約流量又控制并發帶寬和保持服務穩定，同時保持音頻質量。

目前做法的局限性在于：

使用定碼率（CBR）對音頻進行編碼時，碼率得到了有效的控制，但是降低碼率的同時，音頻的質量和細節不能保證。對于不該降低質量的內容場景也采用限制碼率，雖然有效的控制了碼率，但是會導致，在不同的碼率區間，碼率控制不精準，存在一定的抖動；質量不穩定，波動較大；對某些聲音場景（語音、音樂等都存在）質量損傷較大，主觀效果較差。

使用可變碼率（VBR）對音頻進行編碼時，能相對保持質量穩定，但存在碼率整體偏大，且不能精準控制碼率，缺乏在不同碼率分層控制，具體表現為，可變碼率區間比較窄；針對不同的內容，某些內容或某些碼率區間，碼率存在較大的波動，大碼率對質量的貢獻并不大；不能適應實際產品的碼率分層并控制質量穩定的需求。

定碼率（CBR）和可變碼率（VBR）在音頻編碼時，面對不同的任務，都無法做到線性的控制碼率，并保證質量的穩定。

發明內容

針對上述缺點本發明提供了一種結合碼率分層和質量分層的音頻編碼量化控制的方法。本發明的核心思想在于結合碼率和質量量化控制因子（ACRF），找到一種合理的線性映射方式，設置合理的碼率控制區間及質量控制區間的邊界點，實現在均衡質量的同時又可以根據質量需求調節碼率。

本發明提供的一種結合碼率分層和質量分層的音頻編碼量化控制的方法，包括以下步驟：

（1）根據輸入音頻的采樣率建立初始的碼率分檔碼表，所述分檔碼表包括采樣率，單聲道碼率和雙聲道碼率。

（2）根據輸入音頻的幀長度、采樣率和每一通道的碼率要求，確定輸入的音頻采用哪一檔的碼率。

（3）確定目標質量分層和對應的碼率分層。

（4）根據不同的質量控制因子ACRF和初始的碼率分檔碼表，找到對應受控碼率區間邊界，確定質量分層和碼率分層的分界點。

（5）對步驟（4）確定的ACRF和碼率進行預編碼，得到預編碼的碼率范圍，即該質量對應的實際的碼率范圍。

（6）根據得到的每一檔最優的質量量化因子acrf_best，以及最小的質量量化因子min_f和最大的質量量化因子max_f，按線性映射計算最終的編碼質量量化因子：

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。