[發明專利]一種口語比對方法在審

申請號：	201710003810.6	申請日：	2017-01-03
公開（公告）號：	CN106782609A	公開（公告）日：	2017-05-31
發明（設計）人：	楊白宇	申請（專利權）人：	楊白宇
主分類號：	G10L25/51	分類號：	G10L25/51;G09B19/06
代理公司：	暫無信息	代理人：	暫無信息
地址：	250200 山東省濟南市丘市***	國省代碼：	山東;37
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	一種口語方法
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種口語比對方法，其特征在于，方法包括：

S1：設置標準文本，獲取標準文本的標準語音特征，將標準語音特征儲存至數據庫中；

S2：通過用戶朗讀標準文本，獲取用戶語音數據，提取用戶語音數據中的用戶語音特征；

S3：將用戶語音特征與標準語音特征進行對齊，并將用戶語音特征與標準語音特征進行對比；

S4：將用戶語音特征及對比結果儲存至數據庫中。

2.根據權利要求1所述的口語比對方法，其特征在于，方法包括：

步驟S2還包括：

S21將用戶語音數據按時間進行分段，分為n段，以20ms為一時間分段，對每一時間段用戶語音數據加矩形窗，或漢明窗處理得到分段語音信號X_n，n為分段數；

S22對分段語音信號X_n進行短時傅里葉變換，變換為頻域信號，將短時時域信號轉化為頻域信號Y_n，并通過Q_n＝│Y_n│²計算其短時能量譜Q_n；

S23采用先進先出的方式將短時能量譜Q_n從矢量空間S移動至帶通濾波器進行濾波；由于每一個頻帶中分量的作用在人耳中是疊加的，因此將每個濾波器頻帶內的能量進行疊加，這時第k個濾波器輸出功率譜x'(k)；

S24將每個濾波器的輸出取對數，得到相應頻帶的對數功率譜；并進行反離散余弦變換，得到M個MFCC系數，一般M取13～15個；MFCC系數為：

$<mrow><msub><mi>C</mi><mi>n</mi></msub><mo>=</mo><munderover><mo>Σ</mo><mrow><mi>k</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><mi>log</mi><mi> </mi><mi>x</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mi>cos</mi><mrow><mo>(</mo><mo>(</mo><mn>2</mn><mi>k</mi><mo>+</mo><mn>1</mn><mo>)</mo></mrow><mfrac><mi>π</mi><mi>M</mi></mfrac><mo>)</mo><mo>;</mo></mrow>$

S25將得到的MFCC特征作為靜態特征，再將所述靜態特征做一階和二階差分，得到相應的動態特征。

3.根據權利要求1所述的口語比對方法，其特征在于，方法包括：

步驟S2還包括：

獲取每一語音段頻率范圍的頻譜能量(f_k)，該語音段內的頻率上限值k₁,下限值k₂，獲取語音段內的頻譜能量比值PN_n；

$<mrow><msub><mi>PN</mi><mi>n</mi></msub><mo>=</mo><mfrac><mrow><msubsup><mi>Σ</mi><msub><mi>k</mi><mn>1</mn></msub><msub><mi>k</mi><mn>2</mn></msub></msubsup><mi>h</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>k</mi></msub><mo>)</mo></mrow></mrow><mrow><munder><mo>Σ</mo><mi>k</mi></munder><mi>h</mi><mrow><mo>(</mo><msub><mi>f</mi><mi>k</mi></msub><mo>)</mo></mrow></mrow></mfrac><mo>×</mo><mn>100</mn><mi>%</mi><mo>.</mo></mrow>$

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于楊白宇，未經楊白宇許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201710003810.6/1.html，轉載請聲明來源鉆瓜專利網。