[發(fā)明專利]地名語音信號的特征提取方法在審
| 申請?zhí)枺?/td> | 201611180315.4 | 申請日: | 2016-12-19 |
| 公開(公告)號: | CN106782499A | 公開(公告)日: | 2017-05-31 |
| 發(fā)明(設(shè)計)人: | 蔡熙;聶騰云;賴雪軍;謝巍;車松勛 | 申請(專利權(quán))人: | 蘇州金峰物流設(shè)備有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L25/45;G10L25/18;G10L25/21;G10L25/24 |
| 代理公司: | 上海晨皓知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)31260 | 代理人: | 成麗杰 |
| 地址: | 215123 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 地名 語音 信號 特征 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及地名語音信號的特征提取方法,尤其涉及一種地名語音信號的特征提取方法。
背景技術(shù)
隨著經(jīng)濟的高速發(fā)展和全球化趨勢的日益突出,現(xiàn)代物流行業(yè)已在發(fā)達國家得到了空前的發(fā)展,并產(chǎn)生了巨大的經(jīng)濟效益和社會效益,物流資源有運輸、倉儲、分揀、包裝、配送等,這些資源分散在多個領(lǐng)域,包括制造業(yè)、農(nóng)業(yè)、流通業(yè)等。
在分揀環(huán)節(jié)中,現(xiàn)階段基本是人工進行分揀,由于工人們長期處于嘈雜的工作環(huán)境中,心里和身體上勢必會產(chǎn)生一定的疲勞感,并且工作任務(wù)的單一性和重復性也會使他們的工作狀態(tài)過于放松,這必然導致分揀精確性的下降,造成較多不可挽回的分揀失誤事故發(fā)生,工業(yè)領(lǐng)域中對流水線上的產(chǎn)品分揀進行人工檢測的方式已不能滿足現(xiàn)代化工業(yè)的需求。
語音識別發(fā)展到現(xiàn)在,作為人機交互的重要借口已經(jīng)在很多方面改變了我們的生活,從智能家居的語音控制系統(tǒng)到車載語音識別系統(tǒng),語音識別系統(tǒng)給我們帶來了很多方便,因此將語音識別技術(shù)與物流分揀環(huán)節(jié)的融合是物流行業(yè)發(fā)展的必然要求。
而在語音識別技術(shù)中,語音特征提取技術(shù)是語音識別中極為重要的環(huán)節(jié),其效果的好壞直接影響最終的識別結(jié)果,由于將語音識別應用在物流分揀中,主要是對孤立詞的地名語音信號進行特征提取,因此要研究出能夠代表地名語音信號的特征,并且傳統(tǒng)的語音特征提取方法應用于地名語音信號時,特征提取準確率無法保證,同時不能有效適應不同的口音,影響物流分揀的準確性。
發(fā)明內(nèi)容
本發(fā)明的目的就是為了解決現(xiàn)有技術(shù)中存在的上述問題,提供一種地名語音信號的特征提取方法。
本發(fā)明的目的將通過以下技術(shù)方案得以實現(xiàn):
地名語音信號的特征提取方法,包括如下過程:
S1,對經(jīng)過端點檢測得到的地名語音信號進行分幀,并對每一幀進行加窗處理;
S2,對每一幀加窗之后的數(shù)據(jù)進行快速傅里葉變換得到各幀的頻譜,并對地名語音信號的頻譜取模平方得到其功率譜;
S3,取每幀數(shù)據(jù)的前128個數(shù)據(jù)通過Mel三角濾波器組,所述Mel三角濾波器組的設(shè)計過程如下:
S31,根據(jù)公式(1)、最大采樣頻率fs(max)、三角濾波器的數(shù)量k,計算出相鄰兩個三角濾波器的中心頻率的間隔△Mel
△Mel=fs(max)/(k+1)(1);
S32,根據(jù)△Mel算出每個濾波器在梅爾頻率范圍內(nèi)中心頻率的分布之后,求出每一個三角濾波器的左端點Mel頻率、中心點Mel頻率和右端點Mel頻率,并根據(jù)公式(2)將它們轉(zhuǎn)換為實際頻率:
f=(10fm/2595-1)*700 (2)
其中fm為Mel頻率,f為實際頻率;
S33,根據(jù)公式(3)將每個三角濾波器的實際頻率轉(zhuǎn)換成對應的采樣點坐標,并計算出每個三角濾波器的起點、中心點和終點的橫坐標;
X=[f*128/400](3)
其中,X為實際頻率對應的坐標,f為實際頻率,取值范圍在1-4000HZ之間,中括號表示取整;
S34,根據(jù)公式(4)設(shè)計得到Mel三角濾波器組,
其中,Hl(k)表示第l個三角濾波器在位置k的值,k指的是采樣點位置,范圍是0-128,l表示第l個三角濾波器,c(l-1)表示第l個三角濾波器的起點的橫坐標,c(l)表示第l個三角濾波器的中心點的橫坐標,c(l+1)表示第l個三角濾波器的終點的橫坐標;
S4,根據(jù)公式(5)對Mel三角濾波器組的輸出作對數(shù)運算;
其中,s(m)指的是能量譜通過一組濾波器的輸出,N為一幀信號的采樣點個數(shù)的一半,Xa(k)表示第a幀信號的第k個采樣點,Hm(k)表示第m個三角濾波器的第k個值,M為三角濾波器的個數(shù),m指的是第m個濾波器;
S5,將對數(shù)運算得到的數(shù)據(jù)根據(jù)公式(6)進行離散余弦變換,得到13維的向量,即MFCC系數(shù);
其中,L指MFCC系數(shù)的階數(shù),此處為13,N為一幀信號的采樣點個數(shù)的一半,M為三角濾波器的個數(shù),m指的是第m個濾波器;
S6,在獲得地名語音信號的N幀之后,獲得N×13的特征矩陣C,將其的第一行向前擴充三行,內(nèi)容和第一行保持一樣,最后一行向后擴充三行,內(nèi)容和最后一行保持一樣,得到(N+6)×13的特征矩陣,按照公式(7)進行差分,得到N×13的矩陣C'(n);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于蘇州金峰物流設(shè)備有限公司,未經(jīng)蘇州金峰物流設(shè)備有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611180315.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:語音信息播放方法、裝置及終端
- 下一篇:物品識別方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 亮度信號/色信號分離裝置和亮度信號/色信號分離方法
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置
- 雙耳信號的信號生成
- 雙耳信號的信號生成
- 信號處理裝置、信號處理方法、信號處理程序
- USBTYPEC信號轉(zhuǎn)HDMI信號的信號轉(zhuǎn)換線
- 信號盒(信號轉(zhuǎn)換)
- 信號調(diào)制方法、信號調(diào)制裝置、信號解調(diào)方法和信號解調(diào)裝置





