[發明專利]基于連續混合高斯HMM模型的地名語音信號識別方法有效
| 申請號: | 201611177818.6 | 申請日: | 2016-12-19 |
| 公開(公告)號: | CN106782510B | 公開(公告)日: | 2020-06-02 |
| 發明(設計)人: | 蔡熙;聶騰云;賴雪軍;謝巍;車松勛 | 申請(專利權)人: | 蘇州金峰物聯網技術有限公司;上海韻達貨運有限公司 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/065;G10L15/14 |
| 代理公司: | 上海晨皓知識產權代理事務所(普通合伙) 31260 | 代理人: | 成麗杰 |
| 地址: | 215123 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 連續 混合 hmm 模型 地名 語音 信號 識別 方法 | ||
本發明揭示的基于連續混合高斯HMM模型的地名語音信號識別方法,其中連續混合高斯HMM模型的訓練過程如下:定義HMM模型并初始化;將一類地名語音信號的特征矩陣代入模型中進行訓練;根據模型參數求出一類地名語音信號出現的概率;將該概率和訓練之前的輸出概率比較,判斷相對誤差是否滿足輸出條件;符合,輸出該類地名語音信號對應的HMM模型;不符合,判斷訓練次數是否達到最高訓練閾值;未到達,再訓練一次,達到,輸出HMM模型;將若干類地名語音信號的特征矩陣代入模型中,得到若干個不同地名對應的HMM模型,形成地名語音識別模型庫。本發明能夠有得到適合孤立詞的地名語音識別的HMM模型及地名語音識別模型庫,為準確進行地名語音識別創造了條件。
技術領域
本發明涉及地名語音信號識別方法,尤其涉及一種基于連續混合高斯HMM模型的地名語音信號識別方法。
背景技術
隨著經濟的高速發展和全球化趨勢的日益突出,現代物流行業已在發達國家得到了空前的發展,并產生了巨大的經濟效益和社會效益,物流資源有運輸、倉儲、分揀、包裝、配送等,這些資源分散在多個領域,包括制造業、農業、流通業等。
在分揀環節中,現階段基本是人工進行分揀,由于工人們長期處于嘈雜的工作環境中,心里和身體上勢必會產生一定的疲勞感,并且工作任務的單一性和重復性也會使他們的工作狀態過于放松,這必然導致分揀精確性的下降,造成較多不可挽回的分揀失誤事故發生,工業領域中對流水線上的產品分揀進行人工檢測的方式已不能滿足現代化工業的需求。
語音識別發展到現在,作為人機交互的重要借口已經在很多方面改變了我們的生活,從智能家居的語音控制系統到車載語音識別系統,語音識別系統給我們帶來了很多方便,因此將語音識別技術與物流分揀環節的融合是物流行業發展的必然要求。
而物流分揀環節與語音識別技術結合的關鍵之一是如何有效地實現地名語音信號的準確識別,從而為自動化地將各類物品精確地歸類到設定的地方提供技術支撐,目前鮮有看到針對孤立詞的地名進行語音識別的相關技術,因此亟待進行地名語音識別技術的研發。
發明內容
本發明的目的就是為了解決現有技術中存在的上述問題,提供一種基于連續混合高斯HMM模型的地名語音信號識別方法。
本發明的目的將通過以下技術方案得以實現:
基于連續混合高斯HMM模型的地名語音信號識別方法,包括連續混合高斯HMM模型的訓練過程及地名語音識別過程,其中,所述連續混合高斯HMM模型的訓練過程如下:
S1,定義一個包含如下參數的連續混合高斯HMM模型,λ=(N,M,A,π,B),其中:
N,模型狀態數,為4;
M,每個狀態所對應的高斯函數的個數,每個狀態包含3個39維的高斯函數,一個模型中N個狀態中每個狀態高斯函數個數相同;
A,狀態轉移概率矩陣,A={aij},aij=P[qt+1=j/qt=i],1≤i,j≤N,其中,qt=i表示在t時刻處在狀態i,q(t+1)=j表示t+1時刻在狀態j,整體表示從狀態i轉換到狀態j的概率;
π,各狀態的起始概率分布,π=πt,πt=P[qi=i],1≤i≤N,其中,π=πt表示從狀態i開始的概率,下標i表示各個狀態對應的起始概率;
B,輸出概率密度函數,B={bj(o)},1≤j≤N,其中,o為觀察向量,M為每個狀態包含的高斯元的個數;cjl為第j個狀態第l個混合高斯函數的權重,L為正態高斯概率密度函數,μjl為第j個狀態第l個混合高斯元的均值矢量,Ujl為第j個狀態第l個混合高斯元的協方差矩陣;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州金峰物聯網技術有限公司;上海韻達貨運有限公司,未經蘇州金峰物聯網技術有限公司;上海韻達貨運有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611177818.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種語料標注方法和裝置及終端
- 下一篇:修正線性深度自編碼網絡語音識別方法





