[其他]一種利用計算機對漢語語音進行識別的裝置無效
| 申請號: | 85100180 | 申請日: | 1985-04-01 |
| 公開(公告)號: | CN85100180B | 公開(公告)日: | 1987-05-13 |
| 發明(設計)人: | 嚴普強;施昊;靳懷義 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G10L5/06 | 分類號: | G10L5/06 |
| 代理公司: | 清華大學專利事務所 | 代理人: | 付尚新 |
| 地址: | 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 利用 計算機 漢語 語音 進行 識別 裝置 | ||
本發明屬于語音識別領域,利用計算機對漢語語音進行識別。
現在通用的語音分析和識別方法都是將語音信號按等時距的方式采樣,按時間分幀,對每幀的時序數列求取特征,然后進行識別。這種識別方法嚴重依賴于語調和講話速度,因此用這種方法做成的識別裝置依賴于特定的人,并且其識別的詞匯量也是很有限的。1985年第二期《國際電子報》所列的現在已投入市場的各種語音識別插件板即屬此例。
本發明提出一種可以不依賴于特定的使用人并且不受具體詞匯量限制的識別裝置。這一裝置的特點在對語音信號的處理、分析和識別時充分考慮漢語語音的特點和人的發聲與聽覺的機理。本發明將對漢語語音按音素、音節和音調進行識別。對于由聲帶振動發出的語音信號,本發明提出采用提取基頻和同步采樣的技術,然后將采樣的信號序列進行分析,提取語音特征,進行識別。
漢語語音是單音節的,每個音節由一至幾個音素組成。音節和音素的數量都是有限的。漢語的四聲語調和音節中由聲帶振動發音的濁音音素占有重要的地位。在本發明中將充分考慮漢語的這些特點,濁音信號具有周期或準周期信號的特性,在語調變化時其基頻頻率是改變的。如果采用等時距的采樣技術,則數據量很大而且不可避免地引入泄漏誤差等信息模糊。本發明中所用的同步采樣技術可以顯著地壓縮濁音的信息量,它還可以充分地給出語調的特征和語調的變化。
本發明可以發展為用自然的漢語語音作為人-機系統的輸入。本發明中的識別方法可以廣泛應用于各種領域,例如用語音控制各種半自動裝置和工作機械;用語音控制假肢、護理機械;用語音對計算機進行程序編制;聲控打字;用語音鑒別身份的安全保密裝置等。
本發明提出的語音識別裝置框圖如附圖1所示。a是語音,它由話筒〔1〕檢測,轉變為電信號。然后通過一個前置放大器〔2〕。放大后的語音電信號通過一個低通濾波器〔3〕,該濾波器的截止頻率能夠自動搜索并且跟蹤濁音的基頻。〔4〕是對濁音基頻的判斷裝置,然后,將濁音基頻C觸發一個鎖相倍頻器〔5〕,得到與濁音基頻倍頻的采樣脈沖序列d(例如64倍頻)。〔6〕是一個分頻器,它為鎖相回路提供反饋。語音電信號b同時又通過一個抗混疊濾波器〔7〕,然后用A/D轉換器〔8〕進行同步采樣,對于濁音,用其基頻的倍頻脈沖序列d以外觸發的方式采樣。對于清音,則仍以時鐘脈沖采樣。將語音電信號的采樣序列以及基頻的信息都送到計算機〔9〕中進行分析,提取特征并進行識別。圖1中〔10〕是用調模板,〔11〕是音素和音節模板,模板都是預置的,計算機的輸出e是對音素、音節的識別;f是對語調四聲的識別,g是對說話人特征的識別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/85100180/2.html,轉載請聲明來源鉆瓜專利網。





