[發明專利]一種面向貨物分揀的地名語音建模系統的實現方法在審
| 申請號: | 201611007973.3 | 申請日: | 2016-11-16 |
| 公開(公告)號: | CN106601234A | 公開(公告)日: | 2017-04-26 |
| 發明(設計)人: | 謝巍;董萬里;何伶珍 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G10L15/06 | 分類號: | G10L15/06;G10L15/04;G10L15/14;G10L15/22;G10L25/87;G06Q50/28 |
| 代理公司: | 廣州市華學知識產權代理有限公司44245 | 代理人: | 李斌 |
| 地址: | 511458 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 貨物 分揀 地名 語音 建模 系統 實現 方法 | ||
技術領域
本發明涉及信號處理、模式識別與人機交互領域,尤其是一種面向貨物分揀的地名語音建模系統的實現方法。
背景技術
目前物流現場的分揀環節中,主要的分揀方式是通過按鍵來確認貨物要分往的槽口,操作人員必須使用按鍵方式輸入貨物分揀信息,操作比較耗時和麻煩。使用地名語音識別系統可以讓操作員直接和分揀系統進行對話,通知分揀系統貨物的分流信息,這種方式使得貨物分揀更加高效、快捷和省時,地名語音建模系統可對地名語音信號建立隱馬爾科夫模型,方便實現地名語音識別。
發明內容
本發明的目的是針對上述現有技術的不足,提供了一種操作方便、能夠實現人機交互的面向貨物分揀的地名語音建模系統的實現方法。
本發明的目的可以通過如下技術方案實現:
一種面向貨物分揀的地名語音建模系統的實現方法,所述方法包括以下步驟:
1)對語音信號進行預處理,包括預加重和分幀操作;
2)對步驟1)中預處理過的語音信號進行端點檢測和剪切處理;
3)查看步驟2)中剪切之后的語音信號的效果,如果剪切正確,將其保存在指定的文件夾中;
4)當步驟3)中所有語音信號的錄取結束,建立語音信號的隱馬爾科夫模型,并且保存所建立的模型數據。
優選地,步驟1)中,所述預加重操作是將信號通過高通濾波器,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能夠用同樣的信噪比求頻譜。
優選地,步驟2)中使用的端點檢測方法是基于短時能量和短時過零率的雙門限檢測法,具體步驟為:
一、在開始進行端點檢測之前,首先為短時能量和過零率分別設定兩個門限,一個低門限,數值較小,對信號的變化較敏感,容易被超過,另一個高門限,數值較大,信號必須達到設定的強度,該門限才能夠被超過;
二、對語音信號x(n)進行分幀處理,每一幀記為n=1,2,…,N,n為離散語音信號時間序列,N為幀長,i表示幀數;
三、計算每一幀語音信號的短時能量,得到語音信號的短時幀能量:
其中N為幀長,i表示幀數,表示第i幀語音信號的第n(1≤n≤N)個采樣點的值的平方;
四、計算每一幀語音信號的過零率,得到語音信號的短時過零率:
其中:
其中sgn[si(n)]表示第i幀語音信號的第n(1≤n≤N)個采樣點的值;
此時整個端點檢測分為四段:靜音段、過渡段、語音段、結束段,在處于靜音段時,如果短時能量或者過零率超過設定的低門限,標記為起點,進入過渡段后,如果短時能量和過零率兩個參數值都回落到設定的低門限以下,就將當前狀態恢復到靜音段,而如果過渡段中短時能量和過零率兩個參數值中的任一個超過設定的高門限,即被認為進入語音段,處于語音段時,如果短時能量和過零率兩個參數值都降到了設定的低門限以下,而總的計時長度小于最短時間門限,則認為是一段噪音,重新計算語音信號的長度。
優選地,步驟2)中,根據語音信號的音節設定一個閾值length和一個計算可能處于語音段信號長度的變量slience1,如果此變量slience1小于設定的閾值length,則繼續循環,重新計算語音信號的長度,若大于設定的閾值length,則將前面的語音信號舍棄。
優選的,所述面向貨物分揀的地名語音建模系統的硬件,包括一個高性能的降噪耳機和一臺計算機。
優選的,所述面向貨物分揀的地名語音建模系統的操作能夠通過建立操作界面,在操作界面上完成。
本發明與現有技術相比,具有如下優點和有益效果:
1、本發明針對地名語音信號簡短的特點,將每個地名語音信號作為一個識別對象,直接將每個地名的整體作為一個對象建立隱馬爾科夫模型,計算簡單。
2、本發明建立了方便人機交互的圖形界面,方便操作,通過系統可以直接看到語音效果圖以及端點檢測之后的圖片,判斷檢測是否正確,當使用到不同的地域時,可以對特定口音的一群人建模,以提高后續識別的準確率。
附圖說明
圖1為本發明面向貨物分揀的地名語音建模系統的原理圖。
圖2為本發明實施例的改進前端點檢測效果圖。
圖3為本發明實施例的改進后端點檢測效果圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611007973.3/2.html,轉載請聲明來源鉆瓜專利網。





