[發明專利]背景聲頻恢復系統有效
| 申請號: | 00131646.X | 申請日: | 2000-10-06 |
| 公開(公告)號: | CN1292523A | 公開(公告)日: | 2001-04-25 |
| 發明(設計)人: | 杰弗里·C·雷納;埃里克·拉克;保羅·基揚·萬·金;戴維·艾倫·考爾頓 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G06F9/30 | 分類號: | G06F9/30;G06F12/00 |
| 代理公司: | 北京銀龍專利代理有限公司 | 代理人: | 皋吉甫 |
| 地址: | 美國華盛頓*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 背景 聲頻 恢復 系統 | ||
本發明通常涉及多源數據處理系統,特別涉及聲頻識別系統/軟件的背景聲頻恢復系統。
自從發明個人計算機以來,人機交互作用主要通過鍵盤進行。一般,當用戶要將信息或指令輸入給計算機時,他便在與計算機相連的鍵盤上鍵入信息或指令。其他作為輸入裝置而代替鍵盤的輸入裝置包括鼠標、觸摸屏顯示器、集成指示器裝置和掃描儀。這些輸入裝置的使用節省了用戶花在向計算機輸入數據或指令的時間。
基于計算機的聲頻識別和語音識別系統還可用于向個人計算機輸入數據或指令。聲頻識別和語音識別系統將人的語音轉換成可由計算機識別的格式。當計算機裝備了聲頻識別和語音識別系統時,可只通過向計算機說出數據或命令就可完成數據或命令輸入。用戶說話的速度一般快于傳統數據或命令輸入速度。因此,通過人的語言傳遞數據或命令的固有速度是將聲頻識別和語音識別系統與計算機結合所具有的優點。
用戶操作具有聲頻識別和語音識別系統的個人計算機所具有的高效率促進了該系統在工廠的使用。現在各工廠的許多工人將聲頻識別和語音識別系統用于多種應用程序中。例如,DRAGON、IBM和LERNUT?&?HAUSPIE已經設計出利用聲頻識別和語音識別技術的計算機軟件程序。當用戶對聲頻識別程序大聲讀出或口述文件時,該程序能將用戶的話直接輸入在個人計算機操作的字處理程序。
通常,基于計算機的聲頻識別和語音識別程序將人的語音轉換成數字化頻率級數。這些頻率匹配預先存儲的字或音素集。當計算機確定合適匹配頻率級數時,實現人語言部分的計算機識別。對頻率匹配編碼,直到已收集足夠信息使計算機做出反應。然后計算機通過將人的語言存儲在存儲裝置、將人的語言轉換成字處理程序的文件或執行應用程序的命令而對一定語言做出反應。
但是,聲頻識別和語音識別系統不是100%精確。即使通過硬件和軟件修正,最有效的聲頻識別和語音識別系統也只能獲得大約97-99%的精度。內外因素會影響聲頻識別和語音識別系統的可靠性。依賴于識別技術的內部因素包括在有限的字/音素集和說話者的語匯之間比較。外部因素包括環境如地方口音、外部噪聲,麥克風的類型會降低輸入質量,從而影響用戶說話的頻率并將潛在的誤差帶入字或音素匹配。
普通聲頻識別系統具有很高的識別誤差率。已經應用不同辦法來提高識別率和降低識別誤差量。一種解決方法是訓練聲頻識別或語音識別程序以識別特定人的聲頻的頻率。在與說話者相關的聲頻識別系統中,系統產生聲頻配置文件,識別特定人聲頻的獨特發音模式。不能為特定說話人而訓練的系統稱為獨立于說話者的系統,因此由于地方口音或發音的不同更易于產生識別誤差。
另一種解決方法是采用稱為不連續的語音輸入的方法。不連續的語言輸入需要操作者說話速度相對較慢,在每個字之間和在說下一個字之前要停頓。操作者的停頓給聲頻識別系統時間分辨每個操作者說話的開始和結束。依賴于不連續語音輸入的聲頻識別系統速度較慢,對習慣于以正常語速說話的用戶來說很不方便。
另一種解決方法是基于連續語音輸入的方法。連續語音輸入系統要求用戶說出預先儲存在系統詞匯表中的有限字集。因此,該聲頻識別系統依賴于有限的詞匯表。當用戶在具有特定詞匯表的環境中使用該系統時,可以最佳使用這些系統。例如,在醫療衛生業中的特殊領域中,如放射學、整形外科、內科、急救醫學、精神健康等中使用連續語音識別系統。但是,連續語音識別系統受詞匯表的固有缺陷的限制,這限制了其在其他行業或工作環境中的使用性能。
自然語音輸入系統最終會進入市場。這些系統不要求用戶以使計算機識別的特殊方式說話,而且還能識別用戶對計算機的指令和輸入計算機的信息之間的區別。
在下面的公開內容中,術語“聲頻識別”和“語音識別”可作為同義詞使用。聲頻識別和語音識別之間有時會有差別。但是,聲頻識別和語音識別系統會同樣遇到上述的可靠性問題,將同樣的方法應用于兩種識別技術以解決現有技術的不足。
許多多源數據處理系統包括聲頻識別軟件。如上所述,普通聲頻識別軟件有很多缺點。一個主要的缺點是應用聲頻識別軟件的應用程序如字處理程序頻繁損失或不能適當的捕獲由用戶給出的指令。
不能適當捕獲指令有兩個主要原因:丟失口述指令的一個主要原因是由于麥克風狀態指示器或圖標難于設置在顯示器上而使用戶頻繁忘記啟動聲頻識別軟件。不能適當捕獲指令的另一個原因是用戶頻繁假定聲頻識別軟件的麥克風打開并開始口述其想法。但是,過了幾分鐘后,用戶發現沒有記錄或由聲頻識別軟件處理其聲頻命令和/或指令。這樣,用戶必須“打開”或“喚醒”聲頻識別軟件并重新口述其意圖。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/00131646.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:利用原子層沉積法形成薄膜的方法
- 下一篇:視頻顯示設備的基座組件





