[發(fā)明專利]基于連續(xù)混合高斯HMM模型的物流分揀地名語音識別方法、系統(tǒng)及物流分揀系統(tǒng)有效
| 申請?zhí)枺?/td> | 201611177730.4 | 申請日: | 2016-12-19 |
| 公開(公告)號: | CN106601230B | 公開(公告)日: | 2020-06-02 |
| 發(fā)明(設(shè)計(jì))人: | 蔡熙;聶騰云;賴雪軍;謝巍;車松勛 | 申請(專利權(quán))人: | 蘇州金峰物聯(lián)網(wǎng)技術(shù)有限公司;上海韻達(dá)貨運(yùn)有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/05;G10L15/14;G10L25/21 |
| 代理公司: | 上海晨皓知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 31260 | 代理人: | 成麗杰 |
| 地址: | 215123 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 連續(xù) 混合 hmm 模型 物流 分揀 地名 語音 識別 方法 系統(tǒng) | ||
本發(fā)明揭示的基于連續(xù)混合高斯HMM模型的物流分揀地名語音識別方法、系統(tǒng)及物流分揀系統(tǒng),包括如下步驟,接收一未知地名語音信號,進(jìn)行預(yù)處理;通過改進(jìn)的短時(shí)平均能量及過零率的雙門限端點(diǎn)檢測方法進(jìn)行端點(diǎn)檢測并提取形成N×39的特征矩陣;將N×39的特征矩陣代入已建立好的地名語音模型庫中,求取它對每一類地名語音信號對應(yīng)的連續(xù)混合高斯HMM模型的輸出概率,并把所述未知地名語音信號的特征矩陣識別為輸出概率最大的那一類。本發(fā)明設(shè)計(jì)精巧,針對地名語音孤立詞的特點(diǎn),利用隱馬爾科夫模型建立地名語音識別模型庫并進(jìn)行地名語音識別,從而為有效的進(jìn)行物品分揀提供了精確的地址信息,實(shí)現(xiàn)了語音識別技術(shù)和物流分揀技術(shù)的有效結(jié)合。
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別方法、系統(tǒng)及物流分揀系統(tǒng),尤其涉及一種基于連續(xù)混合高斯HMM模型的物流分揀地名語音識別方法、系統(tǒng)及物流分揀系統(tǒng)。
背景技術(shù)
隨著經(jīng)濟(jì)的高速發(fā)展和全球化趨勢的日益突出,現(xiàn)代物流行業(yè)已在發(fā)達(dá)國家得到了空前的發(fā)展,并產(chǎn)生了巨大的經(jīng)濟(jì)效益和社會效益,物流資源有運(yùn)輸、倉儲、分揀、包裝、配送等,這些資源分散在多個(gè)領(lǐng)域,包括制造業(yè)、農(nóng)業(yè)、流通業(yè)等。
在分揀環(huán)節(jié)中,現(xiàn)階段基本是人工進(jìn)行分揀,由于工人們長期處于嘈雜的工作環(huán)境中,心里和身體上勢必會產(chǎn)生一定的疲勞感,并且工作任務(wù)的單一性和重復(fù)性也會使他們的工作狀態(tài)過于放松,這必然導(dǎo)致分揀精確性的下降,造成較多不可挽回的分揀失誤事故發(fā)生,工業(yè)領(lǐng)域中對流水線上的產(chǎn)品分揀進(jìn)行人工檢測的方式已不能滿足現(xiàn)代化工業(yè)的需求。
語音識別發(fā)展到現(xiàn)在,作為人機(jī)交互的重要借口已經(jīng)在很多方面改變了我們的生活,從智能家居的語音控制系統(tǒng)到車載語音識別系統(tǒng),語音識別系統(tǒng)給我們帶來了很多方便,因此將語音識別技術(shù)與物流分揀環(huán)節(jié)的融合是物流行業(yè)發(fā)展的必然要求。
而目前市場上鮮有關(guān)于基于地名語音識別的物流分揀的相關(guān)報(bào)道,因此有必要研究一種分揀效率高、分揀更加精確的分揀系統(tǒng)。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了解決現(xiàn)有技術(shù)中存在的上述問題,提供一種基于連續(xù)混合高斯HMM模型的物流分揀地名語音識別方法、系統(tǒng)及物流分揀系統(tǒng)。
本發(fā)明的目的將通過以下技術(shù)方案得以實(shí)現(xiàn):
基于連續(xù)混合高斯HMM模型的物流分揀地名語音識別方法,包括如下步驟:
S1,接收一未知地名語音信號,進(jìn)行預(yù)處理;
S2,通過改進(jìn)的短時(shí)平均能量及過零率的雙門限端點(diǎn)檢測方法對經(jīng)過預(yù)處理的地名語音信號進(jìn)行端點(diǎn)檢測,剪切出信號段;
S3,對經(jīng)過端點(diǎn)檢測的地名語音信號進(jìn)行特征提取,形成N×39的特征矩陣;
S5,將N×39的特征矩陣代入已建立好的、包含若干不同類地名語音信號對應(yīng)的連續(xù)混合高斯HMM模型的地名語音模型庫中,通過viterbi算法求取它對每一類地名語音信號對應(yīng)的連續(xù)混合高斯HMM模型的輸出概率,并把所述未知地名語音信號的特征矩陣識別為輸出概率最大的那一類,即為該未知地名語音信號對應(yīng)的地名。
優(yōu)選的,所述的基于連續(xù)混合高斯HMM模型的物流分揀地名語音識別方法,其中:所述改進(jìn)的短時(shí)平均能量及過零率的雙門限端點(diǎn)檢測方法包括如下過程:
S21,初始狀態(tài)下,狀態(tài)變量status=0,語音長度計(jì)數(shù)變量count=0,用于計(jì)算未確定進(jìn)入語音段時(shí)可能處于語音段的長度的變量slience1=0,接收經(jīng)過預(yù)處理的地名語音信號,從第一幀信號開始判斷每幀語音信號的能量amp[i]與最低能量閾值amp2、最高能量閾值amp1的大小以及判斷過零率zcr[i]與過零率閾值zcr的大小,確定狀態(tài)變量status的值,其中i為第i幀信號;
S22,當(dāng)當(dāng)前幀語音信號的能量amp[i]<最低能量閾值amp2時(shí),將狀態(tài)變量status設(shè)置為0,表明仍處于靜音段,按照S21步驟進(jìn)行下一幀檢測;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州金峰物聯(lián)網(wǎng)技術(shù)有限公司;上海韻達(dá)貨運(yùn)有限公司,未經(jīng)蘇州金峰物聯(lián)網(wǎng)技術(shù)有限公司;上海韻達(dá)貨運(yùn)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611177730.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種基于soc芯片的語音喚醒方法
- 下一篇:車輛控制方法和裝置





