[發明專利]音素級的低功耗的口語評價與缺陷診斷方法無效
| 申請號: | 201410229058.3 | 申請日: | 2014-05-28 |
| 公開(公告)號: | CN103985392A | 公開(公告)日: | 2014-08-13 |
| 發明(設計)人: | 柳超 | 申請(專利權)人: | 柳超 |
| 主分類號: | G10L25/48 | 分類號: | G10L25/48 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100010 北京市東城區朝陽*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音素 功耗 口語 評價 缺陷 診斷 方法 | ||
1.一種音素級的低功耗的口語評價方法,對于給定的文本,它對應一個音素序列,記做
pall={sil,p1,sil,p2,sil,p3,sil,...,p(M-1),sil,pM,sil},同時提供作為評價參照的標準語音,其特征在于,包括如下步驟:
(1)分別對標準語音和用戶語音進行聲學特征提取,得到每一幀對應的特征向量,進而分別得到標準語音與用戶語音所對應的特征向量序列;
(2)基于加權有限狀態轉換器Q使用Viterbi算法對標準語音和用戶語音所對應所述的特征向量序列進行解碼操作,
(21)針對標準語音:上述音素序列pall的對齊此對齊的計數向量記做
其中sil表示停頓音,表示對應于第i個非停頓音音素的幀的數量,表示對應于第i+1個停頓音的幀的數量,M是此樣本文本對應的非停頓音音素的總數量,上述基于加權有限狀態轉換器Q與Viterbi算法的解碼過程在給出對齊的同時,也給出了每個特征向量所對應的HMM狀態;
(22)針對用戶語音:上述音素序列pall的對齊α,此對齊的計數向量記做
β={ns0,n1,ns1,n2,ns2,n3,ns3,...,n(M-1),ns(M-1),nM,nsM};
其中ni表示對應于第i個非停頓音音素的幀的數量,nsi表示對應于第i+1個停頓音的幀的數量,M是此樣本文本對應的非停頓音音素的總數量,上述基于加權有限狀態轉換器Q與Viterbi算法的解碼過程在給出對齊的同時,也給出了每個特征向量所對應的HMM狀態;
其中在所述步驟(21)和(22)中,
Q=πε(min(det(Hοdet(Cοdet(LοG))))),其中的min表示有關加權有限狀態轉換器的最小化操作,det表示有關加權有限狀態轉換器的確定化操作,符號ο表示有關加權有限狀態轉換器的復合操作,πε表示去除加權有限狀態轉換器中ε符號的操作;
聲學模型H、發音詞典模型L以及上下文相關的音素模型C均為加權有限狀態轉換器,并且均是基于加權有限狀態轉換器的大詞匯量連續語音識別技術的訓練過程得到;對于給定的文本產生相應的語言模型G,從而產生與該文本對應的加權有限狀態轉換器Q;
(3)將用戶語音的對齊α以及其特征向量序列與標準語音的對齊及特征向量序列進行比較,以評價用戶發音質量,二者吻合度越高,說明發音質量越好。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于柳超,未經柳超許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410229058.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種有機電致發光器件
- 下一篇:紫外光固化型大豆油基復合樹脂的制備





