[發明專利]測定多路運行聲信號端點的裝置及方法無效
| 申請號: | 01109574.1 | 申請日: | 2001-04-17 |
| 公開(公告)號: | CN1381829A | 公開(公告)日: | 2002-11-27 |
| 發明(設計)人: | 金潤 | 申請(專利權)人: | 韋爾博泰克公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00 |
| 代理公司: | 永新專利商標代理有限公司 | 代理人: | 韓宏 |
| 地址: | 美國加利*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 測定 運行 信號 端點 裝置 方法 | ||
本發明大致上關于語音識別系統及較特別地是關于連續性聲信號端點測定。
在通過機器自動地語音識別的方法中,此等方法是使機器基于所觀察到的信號的聲學特征及聲學特征與語音聲調的已知關系去解碼一聲信號波形。選擇捕獲語音主要語言特性的聲信號區域同時去除其他區域以改善語音識別的精確度。因為機器僅能處理自原始信號提取出的聲信號區域,若所選擇的區域包含噪音或其他不表示本身語音的人工語音,則將不可能有準確的機器語音識別。另一方面,若舍棄語音的主成份,因為信息一旦失去將永久失去,則下游的語音識別性能將嚴重減低。
清楚地,在用于連續性語音的語音識別方法中,若要達到準確的識別,必須精準地檢測發音的起始點及終止點。一種通過擾動端點來測定端點誤差對測定準確性的影響的多重揚聲器數字測定實驗,已顯示出即使小端點誤差,仍會導致數字測定準確性的顯著減低。例如,若二端點的誤差為±60ms(一般為語音的4個幀),準確性下降3%。再者,當端點誤差增加時,準確度同樣地減低。
最早期的口語音節的端點測定的熟知方法是簡單地以將端點固定在信號的能量密度低于某一預定級的點為基礎,然后在此點切割語音波形并將整個語音波形分解成待處理的片段。在理想的收聽狀況下,此一方法有時候能產生可接受的語音識別結果。然而,在吵雜的背景狀況下,低于特定級的主要語音的能量強度的檢測將很難測定。實際談話環境中的不利狀況一般包含背景噪音、語音失真、及個人的獨特發音特性。來自人們談話及移動、家庭電器用品、機器、交通狀況的背景噪音,幾乎存在住家、辦公室、車子或公共場所等任何環境中。語音圖譜的失真可源自話筒的頻率反應、安裝位置及變換器的品質,以及信號傳送路線中的干擾。再者,各自的說話者各自具有自身獨特的發音傾向,以及甚至對同一說話者而言,因為瞬間的情緒造成沉重呼吸或特別是界于字間的音調改變(已知為倫巴德效應)等其他事情,可能發生語音變化。
再者,一般在單字發音的開始及終止期間,說話者通常產生例如唇響、沉重呼吸及嘴巴開合的聲等人工聲音。對端點檢測而言,特別不易處理者為無聲子音,尤其是摩擦音,例如″s″、″f″、″ch″及″sh″,其通常無法識別成語音的主要部分。摩擦音為聲帶處的狹窄收縮所引起的空氣擾動產生的聲音。如此使得摩擦音很難利用熟知端點檢測技術來記錄,因為其能量級及頻譜特性與聲音背景無顯著差異。再者,因為正常語音包含許多不同的說話速度及聲調,依各自的說話者而定,一種精準的語音識別系統必須具有精準的端點檢測系統以致能解釋此等差異。
語音端點檢測的直接方式為簡單地取得語音的經抽出特征,尋找并界定語音事件,并接著傳送事件至用于辨識的圖形配對算法。直接方式常因為非靜態干擾及吵雜的背景環境而失敗。間接方式考慮通過包含一比較模板中特定聲音背景的模式,同時進行語音檢測與圖形配對過程。間接方式主要通過在特定條件下容許不同語音端點來改良語音檢測,然而,其必須攜帶非常沉重的計算負荷。此混合方式通過僅考慮一小組通過直接方式選擇的合理的端點估算值來降低計算負擔。然而,在分析及級次化等能量線的形式上必須進行可觀的預處理以發現經估算的端點對,由此獲得大量的實驗數據以供辨識合理的端點估算值。
因此,所需要的是一種精確端點檢測系統,其不會舍棄例如無聲輔音的語音的主要部分,且解釋在不利的聲音環境下的一般語音的異常。本發明為用于測定一對精制的用于語音識別處理的聲信號端點的裝置及方法,包含用于處理聲信號的聲信號處理器;一海平面(sea?level)分析儀,其耦合至聲信號處理器,以供測定聲信號的噪音海平面及零穿越率海平面;一有聲部分的初始端點產生器,其耦合至海平面分析儀,以供產生聲信號的第一對起始及終止點;一無聲部分精制端點產生器,其耦合至有聲部分初始端點產生器,以供產生聲信號的第二對起始及終止點;以及一精制產生器,其耦合至無聲部分精制端點產生器,以供利用零穿越率海平面產生聲信號的第三對起始及終止點。
第1圖為典型的語音波形圖,顯示信號幅度及穿越水平軸的信號;
第2圖為說明本發明的端點檢測系統的示意流程圖;
第3圖為說明根據本發明的聲信號處理器的示意流程圖;
第4圖為說明根據本發明的近(enerby)海平面的計算的流程圖;
第5圖為說明根據本發明的零穿越率海平面的計算的流程圖;
第6圖為一秒鐘聲信號的概要說明圖,顯示根據本發明的有聲部分;
第7圖為第6圖的一秒鐘語音發音的概要說明圖,顯示根據本發明的無聲部分;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于韋爾博泰克公司,未經韋爾博泰克公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/01109574.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:外科手術器械
- 下一篇:電化學過程用的無定形金屬/金屬玻璃電極





