[發明專利]一種基于維特比算法的音素識別方法無效
| 申請號: | 201210541534.6 | 申請日: | 2012-12-13 |
| 公開(公告)號: | CN103871406A | 公開(公告)日: | 2014-06-18 |
| 發明(設計)人: | 王雷 | 申請(專利權)人: | 上海八方視界網絡科技有限公司 |
| 主分類號: | G10L15/14 | 分類號: | G10L15/14 |
| 代理公司: | 上海申新律師事務所 31272 | 代理人: | 袁亞軍 |
| 地址: | 200941 上海市寶*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 算法 音素 識別 方法 | ||
技術領域
本發明屬于音素語音識別領域,具體涉及一種利用維特比算法的音素識別方法,即對于已知的漢語音素進行相應識別的方法。
背景技術
音素是音韻學當中語言的最基本單位。在音韻學中,音素的組合便構成了有意義的單元例如詞或者詞素。音素也經常被描述為與表達相對,備用以形成有意義的基本分割單位。由于音素是語音的最小分割單位,能否正確的識別音素在音頻切分、語音識別、語音關鍵詞識別等應用中有非常重要的作用。
目前,音素識別這一課題已經被很多研究者進行了深入的研究分析,其主要的方法已經比較固定。一般情況下,對于音素的識別都是基于每個音素的一小段語音音頻。首先對于音頻進行音頻信號的預處理,即對于音頻信號進行分幀,過濾等。然后將提取相應的音頻特征以用于識別分析,最后利用算法依據提取的音素音頻特征對于音頻文件進行音素識別。
在音素的識別算法中,目前比較流行的是最大熵、互信息、傳統隱馬爾可夫模型、條件隨機域以及人工神經網絡等機器學習等相關算法。而這些算法都有自己相應的問題,例如互信息算法往往需要與別的算法混合,而傳統隱馬爾可夫往往有標簽偏見問題的問題,而機器學習算法在實現上非常復雜。?
發明內容
為克服現有技術上的不足,本發明主要目的在于提供了一種利用維特比算法的音素識別方法,其通過音素中關鍵幀的識別,透過不同幀狀態的轉移作為觀測值,利用維特比算法對于這種狀態轉移進行記錄,從而可以有效地識別出擁有不同特征幀順序的音素,達到音素識別區分的效果。
為解決上述問題,本實用新型采用如下技術方案:
目前主流的音頻識別方法往往在算法復雜度和標簽偏見問題上無法得到很好的權衡,而維特比算法相對而言比較好的解決了這一問題。其最大的特征是狀態轉移不在只參考一個前一個狀態的情況或者觀測值,而是通過遞歸的方式,獲得一個時間序列當中所有觀測值對于狀態轉移的影響。
本發明主要首先需要收集相應的音素樣本作為后面訓練馬爾可夫模型中形成相應的觀測序列的依據。本發明中,所需的音頻特征即簡單的音頻片段語譜圖,也就是每一幀所對應的頻率向量。
而后,會將相應數量的頻率向量結合成為一個向量組作為馬爾可夫模型中的一個觀測值,這主要是為了減少訓練和預測中所需要輸入的輸入數據維度,從而可以有效地降低算法的運行時間效率。
每個音素我們都會收集相應的若干音頻片段并得到該音頻片段的多個幀頻率向量組,每一個向量組我們都會將它認為是一個相應觀測向量中的一個觀測,這樣我們就可以得到所有因素所對應的觀測。同時也會收集一些非音素音頻片段的幀頻率向量組,所有這些向量組便形成輸出觀測值符號集合O(O為每個狀態對應的可能的觀察值數目,記M個觀察值為O1……OM,記t時刻觀察到的觀察值為Ot?其中Ot∈(O1……OM)),O中每一個元素都為一個向量組。
對于收集的所有正反樣本(正樣本為音素的片段,反樣本為非音素片段),我們都將其歸納入狀態集合S(即模型有幾個狀態組成,設有N個狀態,S={Si|i=1,2,……N},記t時刻模型所處的狀態為St,?St∈(S1……SN)),同時對于每個音素片段的最后一個幀頻率向量組,我們都將其加入終了狀態F集合當中。這樣我們已經有了隱馬爾可夫模型中相應的O,S和F集合三個基本要素。
下一步將利用Baum-Welch算法,通過O,S作為輸入,就可以得到最后的隱馬爾可夫另外的三個要素即狀態轉移概率的集合A,輸出觀測值概率的集合B以及系統初始狀態概率的集合π。
在這里,A為所有可能的轉移概率所構成的轉移概率矩陣,即
其中,aij為狀態Si到狀態Sj的狀態轉移概率,1≤I,j≤N,且有0≤aij≤1,。
而B={bj(k)},即:
bj(k)=p[Ot=Vk|St=j],1≤k≤M,
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海八方視界網絡科技有限公司,未經上海八方視界網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210541534.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:塑料透鏡
- 下一篇:基于麥芽糖醇的用于礦棉的膠料組合物和獲得的隔絕性產品





