[發明專利]一種基于WFST的老年人語音情感識別方法在審
| 申請號: | 201710428111.6 | 申請日: | 2017-06-08 |
| 公開(公告)號: | CN107358967A | 公開(公告)日: | 2017-11-17 |
| 發明(設計)人: | 李威;楊繼臣;楊忠明;常亞萍 | 申請(專利權)人: | 廣東科學技術職業學院 |
| 主分類號: | G10L25/63 | 分類號: | G10L25/63;G10L15/06 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司44205 | 代理人: | 俞梁清 |
| 地址: | 519090 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 wfst 老年人 語音 情感 識別 方法 | ||
1.一種基于WFST的老年人語音情感識別方法,其特征在于通過構建WFST網絡,對老年人情感進行識別,包括:
A.使用WFST分別創建情感聲學模型、情感字典、情感語法模型及情感類型轉換器,進一步基于聲學模型、情感字典、情感語法模型及情感類型轉換器構建至少一個WFST圖;
B.使用接收器對WFST圖的每個狀態圖進行計算得到聲學特征的似然度,進一步基于接收器接收數據對WFST圖進行情感識別;
C.基于所述步驟B得到的情感識別結果使用多種倒譜特征和基頻的結合與情感庫進行對比,得到不同情感的情感識別率,進一步,選取最優情感識別率的倒譜特征和基頻的結合對對應的情感進行識別。
2.根據權利要求1所述的基于WFST的老年人語音情感識別方法,所述步驟A還包括:
S21,使用公式得到從情感類型受到G約束的情感類型映射的轉換器,其中L表示情感字典,G表示情感語法模型,用于表示WFST中的運算;
S22,使用公式得到依賴于內容的情感類型到G受約束的情感類型的轉換器,其中C表示從依賴于內容的情感類型到不依賴于情感類型的轉換器;
S23,使用計算得到分布到受G約束的情感映射,進一步,通過情感映射構建對應的WFST圖。
3.根據權利要求1所述的基于WFST的老年人語音情感識別方法,所述步驟B還包括:
S31,獲取需要識別的聲源,解析獲取對應聲源的多個數據幀,進一步得到與數據幀對應的WFST狀態圖;
S32,對對應的多個WFST圖進行進行搜索計算,其中的搜索公式為其中的V為接收器,用于對WFST圖的每個狀態圖進行接收;
S33,對所述步驟S32的搜索計算執行修剪策略,包括對S進行多次修剪,并使用B對S的狀態圖和弧的子集進行接收;
S34,使用Viterbi算法對WFST圖進行識別,其中的識別公式為進一步通過使用B最終找到最優的路徑,完成對聲源的情感識別。
4.根據權利要求1至3任意所述的基于WFST的老年人語音情感識別方法,步驟C通過接收器接收數據對WFST圖進行情感識別,包括:
使用倒譜特征基于WFST圖形識別對情感庫中多個不同類型情感進行進行識別,使用多種基頻基于WFST圖形識別對情感庫中多個不同類型情感進行進行識別,以及,使用倒譜特征與基頻結合基于WFST圖形識別對情感庫中多個不同類型情感進行進行識別,進一步,選取識別對應類型的情感識別率最高的倒譜特征和基頻的結合對對應的情感進行識別作為最終的識別結果。
5.根據權利要求4所述的基于WFST的老年人語音情感識別方法,所述步驟C還包括:
其中倒譜特征包括MFCC、PLPCC及FBANK,其中的情感庫為OPSED情感庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東科學技術職業學院,未經廣東科學技術職業學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710428111.6/1.html,轉載請聲明來源鉆瓜專利網。





