[發明專利]結合聲門激勵和聲道調制信息的漢語語音情感提取及建模方法無效
| 申請號: | 201210211283.5 | 申請日: | 2011-09-30 |
| 公開(公告)號: | CN102750950A | 公開(公告)日: | 2012-10-24 |
| 發明(設計)人: | 毛峽;陳立江 | 申請(專利權)人: | 北京航空航天大學 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L15/18;G10L15/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100191*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 結合 聲門 激勵 聲道 調制 信息 漢語 語音 情感 提取 建模 方法 | ||
1.結合聲門激勵和聲道調制信息的漢語情感建模方法,其步驟如下:
步驟1:結合電聲門圖和語音信號進行濁音段、清音段和靜音段劃分;
步驟1.1:對電聲門圖信號進行帶通濾波,然后對電聲門圖情感語音數據庫中的電聲門圖和語音信號進行分幀處理,幀長256個采樣點,幀移128個采樣點;
步驟1.2:分別提取所有電聲門圖數據幀的對數能量Eegg和語音信號數據幀的對數能量Espeech,根據Eegg的統計結果設定閾值th0,根據Espeech的統計結果設定th1和th2;
步驟1.3:若某數據幀Eegg大于th0并且Espeech大于th2,則該數據幀為濁音,若某數據幀不是濁音并且Espeech大于th1,則該數據幀為清音,其余數據幀為靜音;
步驟2:提取濁音的聲門激勵信息;
步驟2.1:計算各濁音段持續時長的頻數直方圖,并對該頻數直方圖橫縱坐標歸一化之后取對數,以濁音段歸一化對數持續時長為自變量,以持續時長的歸一化對數頻數為因變量,進行一元線性回歸分析,得到濁音段持續時長頻數的雙對數分布參數;
步驟2.2:計算各濁音幀的基頻,依照步驟2.1的方法分別計算基頻曲線上升段和下降段的持續時長頻數的雙對數分布參數;
步驟3:提取濁音和清音的聲道調制信息;
步驟3.1:對濁音幀的電聲門圖和語音信號進行快速傅立葉變換,對轉換到頻域的電聲門圖和語音信號進行能量歸一化,利用頻域相除法,將頻域歸一化語音信號與頻域歸一化電聲門圖信號相除,計算所得結果的10階MEL頻率倒譜系數、前3個共振峰、5個MEL子帶能量、頻譜質心、截止頻率等基本特征及其對時間的一階差分和二階差分,并計算所有基本特征和差分特征的最大值、最小值、均值、標準差、峰度、偏度等衍生參數;
步驟3.2:計算清音的10階MEL頻率倒譜系數、前3個共振峰、5個MEL子帶能量、頻譜質心、截止頻率等基本特征及其對時間的一階差分和二階差分,并計算所有基本特征和差分特征的最大值、最小值、均值、標準差、峰度、偏度等衍生參數;
步驟4:根據步驟1至步驟3得到的聲門激勵和聲道調制特征參數建立六種情感支持向量機一對多分類模型;
步驟4.1:以電聲門圖情感語音數據庫為基礎,計算步驟1至步驟3提取的每種特征的6個Fisher比率,每個Fisher比率對應一種情感;
步驟4.2:根據步驟4.1得到的Fisher比率的排序選擇適用于每種支持向量機模型的特征參數,為每種情感訓練一對多支持向量機模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京航空航天大學,未經北京航空航天大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210211283.5/1.html,轉載請聲明來源鉆瓜專利網。





