[發(fā)明專利]一種結(jié)合碼率分層和質(zhì)量分層的音頻編碼量化控制的方法有效
| 申請(qǐng)?zhí)枺?/td> | 202011105481.4 | 申請(qǐng)日: | 2020-10-15 |
| 公開(公告)號(hào): | CN112420059B | 公開(公告)日: | 2022-04-19 |
| 發(fā)明(設(shè)計(jì))人: | 梅元?jiǎng)?/a>;劉宇新;朱政 | 申請(qǐng)(專利權(quán))人: | 杭州微幀信息科技有限公司 |
| 主分類號(hào): | G10L19/00 | 分類號(hào): | G10L19/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 310012 浙江省杭*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 結(jié)合 分層 質(zhì)量 音頻 編碼 量化 控制 方法 | ||
1.一種結(jié)合碼率分層和質(zhì)量分層的音頻編碼量化控制的方法,其特征在于,包括以下步驟:
(1)根據(jù)輸入音頻的采樣率建立初始的碼率分檔碼表,所述分檔碼表包括采樣率,單聲道碼率和雙聲道碼率;
(2)根據(jù)輸入音頻的幀長(zhǎng)度、采樣率和每一通道的碼率要求,確定輸入的音頻采用哪一檔的碼率;
(3)確定目標(biāo)質(zhì)量分層和對(duì)應(yīng)的碼率分層;
(4)根據(jù)不同的質(zhì)量控制因子ACRF和初始的碼率分檔碼表,找到對(duì)應(yīng)受控碼率區(qū)間邊界,確定質(zhì)量分層和碼率分層的分界點(diǎn);
(5)對(duì)步驟(4)確定的ACRF和碼率進(jìn)行預(yù)編碼,得到預(yù)編碼的碼率范圍,即該質(zhì)量對(duì)應(yīng)的實(shí)際的碼率范圍;
(6)根據(jù)得到的每一檔最優(yōu)的質(zhì)量量化因子acrfbest,以及最小的質(zhì)量量化因子min_f和最大的質(zhì)量量化因子max_f,按線性映射計(jì)算最終的編碼質(zhì)量量化因子:
acrf= min_f + (max_f - min_f) * (max_f - min_f)* acrfbest / (max_acrf -min_acrf)
其中min_acrf是整個(gè)編碼質(zhì)量量化因子區(qū)間的最小值,max_acrf是整個(gè)編碼質(zhì)量量化因子區(qū)間的最大值,使用ACRF來控制碼率和質(zhì)量,其區(qū)間為(min_acrf,max_acrf),acrf即為當(dāng)前選用的編碼質(zhì)量量化因子;
(7)利用步驟(6)得到的acrf對(duì)應(yīng)的碼率進(jìn)行編碼:在幀編碼級(jí)別進(jìn)行總碼率平滑控制;產(chǎn)生碼率糾偏并匯總到趨勢(shì)表,以用作下個(gè)控制期間的參考及幀級(jí)別的精細(xì)控制,通過PESQ對(duì)編碼后的音頻進(jìn)行評(píng)分,質(zhì)量偏差PESQ在0.15以內(nèi),即停止糾偏,說明在該碼率下BDrate最高,在區(qū)間內(nèi)相對(duì)質(zhì)量最好;其中,BDrate表征碼率消耗和質(zhì)量提升的對(duì)應(yīng)關(guān)系;
(8)根據(jù)全局的匯總趨勢(shì)表,對(duì)采樣率、原始音頻的碼率和聲道數(shù)量進(jìn)行自動(dòng)分類,用于最快的初始碼率檔匹配和質(zhì)量檔匹配,形成“質(zhì)量曲線及碼率表”;所述初始碼率檔指的是步驟(1)所述的根據(jù)采樣率建立的初始的碼率分檔碼表,所述質(zhì)量檔指的是步驟(3)和步驟(4)質(zhì)量分層。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州微幀信息科技有限公司,未經(jīng)杭州微幀信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011105481.4/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G10L 語音分析或合成;語音識(shí)別;音頻分析或處理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用頻譜分析,例如變換聲碼器或子頻帶聲碼器
G10L19-04 .利用預(yù)測(cè)技術(shù)
G10L19-06 ..例如短期預(yù)測(cè)系數(shù)的頻譜特征的確定或編碼
G10L19-08 ..激勵(lì)函數(shù)的確定或編碼;長(zhǎng)期預(yù)測(cè)參數(shù)的確定或編碼
G10L19-14 ..不包括在G10L 19/06至G10L 19/12組中的零部件,例如增益編碼、后置濾波設(shè)計(jì)或聲碼器結(jié)構(gòu)
- 自動(dòng)配置藍(lán)牙A2DP傳輸音頻編碼格式的方法和系統(tǒng)
- 一種多路音頻處理方法、音頻播放終端及音頻接收裝置
- 一種音頻處理方法、裝置及終端設(shè)備
- 一種音頻質(zhì)量的檢測(cè)方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 音頻分離方法、裝置、設(shè)備及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 一種音頻播放方法、裝置、以及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 一種音頻錄制系統(tǒng)
- 一種音頻共享系統(tǒng)及方法
- 音頻樣本生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 音頻處理方法和裝置





