[發明專利]一種基于語音屬性分類的交互系統及其方法有效
| 申請號: | 201610244968.8 | 申請日: | 2016-04-19 |
| 公開(公告)號: | CN105761720B | 公開(公告)日: | 2020-01-07 |
| 發明(設計)人: | 潘復平 | 申請(專利權)人: | 北京地平線機器人技術研發有限公司 |
| 主分類號: | G10L15/22 | 分類號: | G10L15/22;G10L15/02;G10L15/06;G10L15/08;G10L25/30;G10L25/63;G10L25/66 |
| 代理公司: | 11497 北京市正見永申律師事務所 | 代理人: | 黃小臨;王懷章 |
| 地址: | 100085 北京市海淀區上地信息路1號(北京實創高*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語音 屬性 分類 交互 系統 及其 方法 | ||
1.一種基于語音屬性分類的交互系統,所述系統包括:
聲學特征提取單元,配置用于提取輸入的語音信號的每幀語音的至少一個聲學特征;
語音屬性分類單元,配置用于將所述每幀語音的所述至少一個聲學特征輸入兩個以上屬性識別分類器,產生兩個以上語音屬性值的輸出,標識每個屬性的概率,通過所述兩個以上屬性識別分類器計算所述語音信號所有語音幀的概率輸出的平均值作為所述語音信號的最終概率,確定所述至少一個聲學特征的語音屬性值,其中,每一個屬性識別分類器輸出一個語音屬性值,得到兩個以上語音屬性結果;
交互決策單元,配置用于基于所述兩個以上語音屬性結果,做出交互內容的決策,輸出反饋信息。
2.根據權利要求1所述的系統,其特征在于,所述聲學特征提取單元包括前段處理單元,所述前段處理單元配置用于對輸入的語音信號進行數字化預處理和語音端點檢測。
3.根據權利要求1所述的系統,其特征在于,所述聲學特征提取單元包括,配置用于提取語音的基頻、梅爾頻率倒譜系數(MFCC)、共振峰。
4.根據權利要求3所述的系統,其特征在于,所述聲學特征提取單元,配置用于提取的所述聲學特征還包括至少以下一項:短時能量特征、基音抖動和閃爍、諧波噪聲比。
5.根據權利要求1所述的系統,其特征在于,所述語音屬性分類單元,包括至少以下一種屬性識別分類器:性別屬性識別分類器,年齡屬性識別分類器,情緒屬性識別分類器,健康屬性識別分類器。
6.根據權利要求1所述的系統,其特征在于,所述屬性識別分類器采用深度神經網絡(DNN)算法。
7.根據權利要求6所述的系統,其特征在于,所述屬性識別分類器的工作模式分為訓練模式和測試模式,其中訓練模式采用兩段式訓練,包括預訓練階段和微調階段,在預訓練階段采用無監督受限玻爾茲曼機模型,在微調階段采用誤差反向傳播算法。
8.一種基于語音屬性分類的交互方法,所述方法包括:
提取輸入的語音信號的每幀語音的至少一個聲學特征;
將所述每幀語音的所述至少一個聲學特征輸入兩個以上屬性識別分類器,產生兩個以上語音屬性值的輸出,標識每個屬性的概率,通過所述兩個以上屬性識別分類器計算所述語音信號所有語音幀的概率輸出的平均值作為所述語音信號的最終概率,經屬性識別分類確定所述至少一個聲學特征的語音屬性值,其中,每一個屬性識別分類器輸出一個語音屬性值,得到兩個以上語音屬性結果;
基于所述兩個以上語音屬性結果,做出交互內容的決策,輸出反饋信息。
9.根據權利要求8所述的方法,其特征在于,所提取輸入的語音信號的聲學特征,包括前段處理,所述前段處理用于對輸入的語音信號進行數字化預處理和語音端點檢測。
10.根據權利要求8所述的方法,其特征在于,所述聲學特征包括,語音的基頻、梅爾頻率倒譜系數(MFCC)、共振峰。
11.根據權利要求10所述的方法,其特征在于,所述聲學特征還包括至少以下一項:短時能量特征、基音抖動和閃爍、諧波噪聲比。
12.根據權利要求8所述的方法,其特征在于,所述語音屬性分類,包括至少以下一種屬性識別分類:性別屬性識別分類,年齡屬性識別分類,情緒屬性識別分類,健康屬性識別分類。
13.根據權利要求8所述的方法,其特征在于,所述屬性識別分類采用深度神經網絡(DNN)算法。
14.根據權利要求13所述的方法,其特征在于,所述屬性識別分類的工作模式分為訓練模式和測試模式,其中訓練模式采用兩段式訓練,包括預訓練階段和微調階段,在預訓練階段采用無監督受限玻爾茲曼機模型,在微調階段采用誤差反向傳播算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京地平線機器人技術研發有限公司,未經北京地平線機器人技術研發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610244968.8/1.html,轉載請聲明來源鉆瓜專利網。





