[發明專利]基于自然音頻統計特性的無參考音頻質量評價方法和裝置有效
| 申請號: | 202010171602.9 | 申請日: | 2020-03-12 |
| 公開(公告)號: | CN111508528B | 公開(公告)日: | 2023-02-28 |
| 發明(設計)人: | 閔雄闊;翟廣濤;楊小康 | 申請(專利權)人: | 上海交通大學 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L25/27;G06F17/18 |
| 代理公司: | 上海恒慧知識產權代理事務所(特殊普通合伙) 31317 | 代理人: | 劉翠 |
| 地址: | 200240 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 自然 音頻 統計 特性 參考 質量 評價 方法 裝置 | ||
1.一種基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,包括:
S1:對輸入音頻信號進行正則化處理,得到正則化后音頻信號;
S2:利用自然音頻統計特性,對S1中得到的正則化后音頻信號進行建模,得到音頻信號統計模型;
S3:提取基于S2中得到的自然音頻統計模型的音頻質量特征;
S4:對S3中得到的音頻質量特征進行特征回歸操作,得到最終的音頻質量估計;
所述S2中,利用自然音頻統計特性對正則化后音頻信號進行自然音頻統計模型建模過程如下:
采用廣義高斯分布對正則化后音頻信號進行描述:
式中,f(x;α,σ2)表示正則化后音頻信號所服從的概率密度函數;x表示正則化后音頻信號樣本值;α表示一個參數,用于控制分布的形狀;σ2用于控制分布的方差;Γ(·)表示如下伽馬函數:
β表示以下參數:
采用非對稱廣義高斯分布,對與正則化后音頻信號相鄰的兩個樣本及之間的乘積進行描述:
式中,表示正則化后音頻信號相鄰樣本乘積所服從的概率密度函數,v表示一個參數,用于控制分布的形狀;σl表示一個參數,用于控制左側分布的方差;σr表示一個參數,用于控制右側分布的方差;βl及βr表示以下參數:
所述S3中,從自然音頻統計模型中提取能夠描述音頻質量的分布參數;其中,廣義高斯分布的形狀參數α和方差參數σ2用于描述音頻質量,非對稱廣義高斯分布的形狀參數v、左方差參數右方差參數及其均值參數η均用于描述音頻質量;
其中:
2.根據權利要求1所述的基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,所述S1中,對輸入音頻信號進行正則化處理過程如下:
其中,α(t)為原始音頻信號,為正則化之后的音頻信號,t為時序索引,c是根據音頻信號動態范圍設定的一個用于保持除式穩定的常數;μ(t)及σ(t)分別表示音頻信號的局部均值及標準差:
其中,wτ,τ=-T,...,T表示一個一維的局部高斯窗。
3.根據權利要求1所述的基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,所述S3中,還包括:將輸入音頻信號下采樣,然后提取多個尺度上的音頻質量特征。
4.根據權利要求1-3任一項所述的基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,所述S4中,對S3中提取的音頻質量特征進行特征回歸,得到一個描述音頻總體質量的單一質量分數。
5.根據權利要求4所述的基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,對音頻質量特征進行特征回歸操作,采用機器學習特征融合方法。
6.根據權利要求5所述的基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,所述機器學習特征融合方法采用支持向量機進行特征融合。
7.根據權利要求4所述的基于自然音頻統計特性的無參考音頻質量評價方法,其特征在于,對音頻質量特征進行特征回歸操作,采用神經網絡的深度學習特征融合方法。
8.一種基于自然音頻統計特性的無參考音頻質量評價裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時可用于執行權利要求1-7任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海交通大學,未經上海交通大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010171602.9/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種全參考音頻質量評價方法及裝置
- 下一篇:一種基于區塊鏈的收衣取衣服務系統





