[發明專利]一種口語比對方法在審
| 申請號: | 201710003810.6 | 申請日: | 2017-01-03 |
| 公開(公告)號: | CN106782609A | 公開(公告)日: | 2017-05-31 |
| 發明(設計)人: | 楊白宇 | 申請(專利權)人: | 楊白宇 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G09B19/06 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 250200 山東省濟南市丘市*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 口語 方法 | ||
1.一種口語比對方法,其特征在于,方法包括:
S1:設置標準文本,獲取標準文本的標準語音特征,將標準語音特征儲存至數據庫中;
S2:通過用戶朗讀標準文本,獲取用戶語音數據,提取用戶語音數據中的用戶語音特征;
S3:將用戶語音特征與標準語音特征進行對齊,并將用戶語音特征與標準語音特征進行對比;
S4:將用戶語音特征及對比結果儲存至數據庫中。
2.根據權利要求1所述的口語比對方法,其特征在于,方法包括:
步驟S2還包括:
S21將用戶語音數據按時間進行分段,分為n段,以20ms為一時間分段,對每一時間段用戶語音數據加矩形窗,或漢明窗處理得到分段語音信號Xn,n為分段數;
S22對分段語音信號Xn進行短時傅里葉變換,變換為頻域信號,將短時時域信號轉化為頻域信號Yn,并通過Qn=│Yn│2計算其短時能量譜Qn;
S23采用先進先出的方式將短時能量譜Qn從矢量空間S移動至帶通濾波器進行濾波;由于每一個頻帶中分量的作用在人耳中是疊加的,因此將每個濾波器頻帶內的能量進行疊加,這時第k個濾波器輸出功率譜x'(k);
S24將每個濾波器的輸出取對數,得到相應頻帶的對數功率譜;并進行反離散余弦變換,得到M個MFCC系數,一般M取13~15個;MFCC系數為:
S25將得到的MFCC特征作為靜態特征,再將所述靜態特征做一階和二階差分,得到相應的動態特征。
3.根據權利要求1所述的口語比對方法,其特征在于,方法包括:
步驟S2還包括:
獲取每一語音段頻率范圍的頻譜能量(fk),該語音段內的頻率上限值k1,下限值k2,獲取語音段內的頻譜能量比值PNn;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于楊白宇,未經楊白宇許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710003810.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于導講機器人的語言交流與互動系統及其工作方法
- 下一篇:一種視頻播放器





