[發明專利]一種面向語音情感識別的語譜特征提取方法在審
| 申請號: | 201510020519.0 | 申請日: | 2015-01-16 |
| 公開(公告)號: | CN104637497A | 公開(公告)日: | 2015-05-20 |
| 發明(設計)人: | 梁瑞宇;馮月芹;唐閨臣;王青云;花濤;包永強;陳姝;顧保府 | 申請(專利權)人: | 南京工程學院 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/03 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 211167 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 語音 情感 識別 特征 提取 方法 | ||
1.一種面向語音情感識別的語譜特征提取方法,其特征在于:包括以下步驟,
步驟一,對語音信號分幀,并進行快速傅里葉變換得到對應的語譜圖;
步驟二,對語譜圖進行分解
將圖像與線性分解高斯核進行卷積運算,在不同的尺度上進行不同通道的分解,得到多通道多尺度的分解圖像;所述通道包括顏色通道、亮度通道和方向通道;
步驟三,對分解圖像進行中央周邊差運算并歸一化,得到每幅分解圖的特征圖;
步驟四,提取每幅特征圖的特征矩陣
將特征圖分成m行n列,共m×n個子區域,用每個子區域的均值替代該子區域,將特征圖歸一化為m×n的特征矩陣;
步驟五,特征矩陣降維并重構
將每幅特征圖對應的特征矩陣重塑為1×mn的特征向量,并由這些特征向量構成特征向量矩陣,通過對特征向量做主成分分析并保留其99%的主元,得到主特征向量矩陣。
2.根據權利要求1所述的一種面向語音情感識別的語譜特征提取方法,其特征在于:同一通道不同尺度上的分解圖像之間的關系為P(σ)=P(σ-1)/2,其中,P(σ)表示尺度σ上的分解圖像,P(1)表示原圖像。
3.根據權利要求1所述的一種面向語音情感識別的語譜特征提取方法,其?特征在于:顏色通道分解,圖像被分解成兩組分解圖像,分別為PR-G(σ)和PB-Y(σ),
PR-G(σ)=(r-g)/max(r,g,b)
PB-Y(σ)=(b-min(r,g))/max(r,g,b)
其中,PR-G(σ)和PB-Y(σ)分別表示R-G和B-Y顏色對在尺度σ上的分解圖像,r、g、b分別表示一幅彩色圖像中紅、綠、藍分量值,min(·)表示取最小值,max(·)表示取最大值;
亮度通道分解,分解圖像為PI(σ),PI(σ)=(r+g+b)/3,表示在尺度σ上的亮度通道分解圖像用r、g和b分量的平均值表示,I代表亮度通道;
方向通道分解,分解圖像通過二維Gabor方向濾波器來提取,將濾波器與相應尺度的圖像進行卷積得到方向通道上的分解圖像Pθ(σ),
Pθ(σ)=|PI(σ)×G0(θ)|+|PI(σ)×Gπ/2(θ)|
其中,G0(θ)和Gπ/2(θ)為Gabor方向濾波器,其中0和π/2代表相位,θ代表角度。
4.根據權利要求3所述的一種面向語音情感識別的語譜特征提取方法,其特征在于:得到每幅分解圖的特征圖的過程為,將中央尺度與周邊尺度的分解圖進行跨尺度點對點相減,然后歸一化得到特征圖FPi,
FPi=N(|Pe(σc)-Pe(σs)|),i∈[1,l]
其中,e∈{R-G,B-Y,I,θ},σc表示中央尺度,σs表?示周邊尺度,σs=σc+d,Pe(σc)表示在尺度σc上的e所代表通道的分解圖像,Pe(σs)表示在尺度σs上的e所代表通道的分解圖像,d代表中央尺度和周邊尺度的差值,N代表歸一化操作,l為特征圖的個數,l等于e的長度乘以σc的長度,再乘以σs的長度。
5.根據權利要求4所述的一種面向語音情感識別的語譜特征提取方法,其特征在于:所述θ={0°,45°,90°,135°},σc={2,3},d={2}。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京工程學院,未經南京工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510020519.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光盤設備、其控制方法、程序和信息存儲介質
- 下一篇:響弦鼓





