[發明專利]一種面向貨物分揀的地名語音建模系統的實現方法在審
| 申請號: | 201611007973.3 | 申請日: | 2016-11-16 |
| 公開(公告)號: | CN106601234A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 謝巍;董萬里;何伶珍 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/04;G10L15/14;G10L15/22;G10L25/87;G06Q50/28 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 李斌 |
| 地址: | 511458 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 貨物 分揀 地名 語音 建模 系統 實現 方法 | ||
1.一種面向貨物分揀的地名語音建模系統的實現方法,其特征在于:所述方法包括以下步驟:
1)對語音信號進行預處理,包括預加重和分幀操作;
2)對步驟1)中預處理過的語音信號進行端點檢測和剪切處理;
3)查看步驟2)中剪切之后的語音信號的效果,如果剪切正確,將其保存在指定的文件夾中;
4)當步驟3)中所有語音信號的錄取結束,建立語音信號的隱馬爾科夫模型,并且保存所建立的模型數據。
2.根據權利要求1所述的一種面向貨物分揀的地名語音建模系統的實現方法,其特征在于:步驟1)中,所述預加重操作是將信號通過高通濾波器,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能夠用同樣的信噪比求頻譜。
3.根據權利要求1所述的一種面向貨物分揀的地名語音建模系統的實現方法,其特征在于:步驟2)中使用的端點檢測方法是基于短時能量和短時過零率的雙門限檢測法,具體步驟為:
一、在開始進行端點檢測之前,首先為短時能量和過零率分別設定兩個門限,一個低門限,數值較小,對信號的變化較敏感,容易被超過,另一個高門限,數值較大,信號必須達到設定的強度,該門限才能夠被超過;
二、對語音信號x(n)進行分幀處理,每一幀記為n=1,2,…,N,n為離散語音信號時間序列,N為幀長,i表示幀數;
三、計算每一幀語音信號的短時能量,得到語音信號的短時幀能量:
其中N為幀長,i表示幀數,表示第i幀語音信號的第n(1≤n≤N)個采樣點的值的平方;
四、計算每一幀語音信號的過零率,得到語音信號的短時過零率:
其中:
其中sgn[si(n)]表示第i幀語音信號的第n(1≤n≤N)個采樣點的值;
此時整個端點檢測分為四段:靜音段、過渡段、語音段、結束段,在處于靜音段時,如果短時能量或者過零率超過設定的低門限,標記為起點,進入過渡段后,如果短時能量和過零率兩個參數值都回落到設定的低門限以下,就將當前狀態恢復到靜音段,而如果過渡段中短時能量和過零率兩個參數值中的任一個超過設定的高門限,即被認為進入語音段,處于語音段時,如果短時能量和過零率兩個參數值都降到了設定的低門限以下,而總的計時長度小于最短時間門限,則認為是一段噪音,重新計算語音信號的長度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611007973.3/1.html,轉載請聲明來源鉆瓜專利網。





