[發明專利]一種面向語音情感識別的語譜特征提取方法在審
| 申請號: | 201510020519.0 | 申請日: | 2015-01-16 |
| 公開(公告)號: | CN104637497A | 公開(公告)日: | 2015-05-20 |
| 發明(設計)人: | 梁瑞宇;馮月芹;唐閨臣;王青云;花濤;包永強;陳姝;顧保府 | 申請(專利權)人: | 南京工程學院 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L25/03 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 211167 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 語音 情感 識別 特征 提取 方法 | ||
技術領域
本發明涉及一種面向語音情感識別的語譜特征提取方法,屬于語音情感識別技術領域。
背景技術
隨著人機交互技術的發展需求,語音情感識別已成為關鍵技術之一。為了使人機交互系統和機器人的對話系統更加智能和完善,語音的情感分析變得越來越重要。此外,在一些長時間的、單調的、高強度的任務(如航天、航海等)中,相關人員常產生某些負面的情緒。有效的識別這些負面情緒,有助于提高個體認知和工作效率,防患于未然。面向兒童的早期情感分析,也逐漸成為語音情感識別的一個重要研究方向。因此,語音情感識別算法仍然具有重要的應用研究價值。
在語音情感識別的實用性研究方面,很多學者做了很多有益的嘗試,獲得不少有價值的成果。在提高算法魯棒性研究方面,有學者提出了一些抗噪性能較好的情感識別算法。在語音情感識別模型研究方面,許多基于不同方法的識別模型被提出,比如加權稀疏識別模型、說話人無關的識別模型、基于詞法語義的識別模型等等。鑒于特征參數的選取與構造對情感識別性能的影響較大,許多學者都對情感特征進行了細致的分析和研究,并提出多種語音情感特征的構造方式。上述研究雖然獲得了一定的研究成果,但是語音情感特征的選擇與構建仍然沒有定論,需要進一步的研究。
語音情感識別的常用特征大致可歸納為韻律學特征、譜特征和音質特征這?三種類型。目前這三類語音特征不是時域特征,就是頻域特征,缺少針對時頻特征對于語音情感識別影響的研究。語譜圖作為一種語音能量的時頻分布的可視化表達方式,本身就包含了一些語音特征,如能量,共振峰,基頻,音調等。因此國內外學者針對語譜圖進行了相關研究,突破目前語音信號處理的時頻特征的單一性。基于語譜的研究主要包括聲分類、聲音識別、聲音增強等,但是尚沒有基于語譜特征的語音情感識別的算法研究。
發明內容
為了解決上述技術問題,本發明提供了一種面向語音情感識別的語譜特征提取方法。
為了達到上述目的,本發明所采用的技術方案是:
一種面向語音情感識別的語譜特征提取方法,包括以下步驟,
步驟一,對語音信號分幀,并進行快速傅里葉變換得到對應的語譜圖;
步驟二,對語譜圖進行分解
將圖像與線性分解高斯核進行卷積運算,在不同的尺度上進行不同通道的分解,得到多通道多尺度的分解圖像;所述通道包括顏色通道、亮度通道和方向通道;
步驟三,對分解圖像進行中央周邊差運算并歸一化,得到每幅分解圖的特征圖;
步驟四,提取每幅特征圖的特征矩陣
將特征圖分成m行n列,共m×n個子區域,用每個子區域的均值替代該子區域,將特征圖歸一化為m×n的特征矩陣;
步驟五,特征矩陣降維并重構
將每幅特征圖對應的特征矩陣重塑為1×mn的特征向量,并由這些特征向量構成特征向量矩陣,通過對特征向量做主成分分析并保留其99%的主元,得到主特征向量矩陣。
同一通道不同尺度上的分解圖像之間的關系為P(σ)=P(σ-1)/2,其中,P(σ)表示尺度σ上的分解圖像,P(1)表示原圖像。
顏色通道分解,圖像被分解成兩組分解圖像,分別為PR-G(σ)和PB-Y(σ),
PR-G(σ)=(r-g)/max(r,g,b)
PB-Y(σ)=(b-min(r,g))/max(r,g,b)
其中,PR-G(σ)和PB-Y(σ)分別表示R-G和B-Y顏色對在尺度σ上的分解圖像,r、g、b分別表示一幅彩色圖像中紅、綠、藍分量值,min(·)表示取最小值,max(·)表示取最大值;
亮度通道分解,分解圖像為PI(σ),PI(σ)=(r+g+b)/3,表示在尺度σ上的亮度通道分解圖像用r、g和b分量的平均值表示,I代表亮度通道;
方向通道分解,分解圖像通過二維Gabor方向濾波器來提取,將濾波器與相應尺度的圖像進行卷積得到方向通道上的分解圖像Pθ(σ),
Pθ(σ)=|PI(σ)×G0(θ)|+|PI(σ)×Gπ/2(θ)|
其中,G0(θ)和Gπ/2(θ)為Gabor方向濾波器,其中0和π/2代表相位,θ代表角度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京工程學院,未經南京工程學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510020519.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:光盤設備、其控制方法、程序和信息存儲介質
- 下一篇:響弦鼓





