[發明專利]用數字化語音中呈現的詞來索引數字化語音的方法和裝置有效
| 申請號: | 200810083001.1 | 申請日: | 2008-03-17 |
| 公開(公告)號: | CN101271689A | 公開(公告)日: | 2008-09-24 |
| 發明(設計)人: | 小查爾斯·W·克羅斯;弗蘭克·L·賈尼亞 | 申請(專利權)人: | 國際商業機器公司 |
| 主分類號: | G10L15/00 | 分類號: | G10L15/00;G10L15/08;G10L15/22;G06F17/30 |
| 代理公司: | 北京市柳沈律師事務所 | 代理人: | 黃小臨 |
| 地址: | 美國紐*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數字化 語音 呈現 索引 方法 裝置 | ||
技術領域
本發明的領域是數據處理,或更具體地,用于索引數字化語音的方法、裝置和產品。
背景技術
通過鍵盤或觸針(stylus)用運行在設備上的應用的用戶交互已經變得越來越受限和麻煩,因為那些設備已經變得越來越小、越來越移動且越來越復雜。具體地,像移動電荷和PDA的小型手持設備具有許多功能,且具有足夠的處理能力來通過多模式存取、即通過以非話音模式以及話音模式的交互來支持用戶交互。支持多模式存取的設備組合在允許用戶同時通過多個輸入模式或通道用設備上的應用來交互的相同交互中的多個用戶輸入模式或通道。輸入的方法包括語音識別、鍵盤、觸摸屏、觸針、鼠標、手寫板等等。多模式輸入通常使得更容易地使用自動化設備。
如果一人正在分析人類語音且感興趣于音頻數據中詞的位置,用數字音頻編輯器來分析音頻數據是很乏味的。可以由通過用于在多模式瀏覽器上顯示的網頁服務器提供的多組標記文檔來形成多模式數字音頻編輯器,包括多模式數字音頻編輯器。在本說明書中使用的作為術語的“多模式瀏覽器”通常意味著能夠接收多模式輸入且用多模式輸出與用戶交互的網頁瀏覽器,其中多模式輸入和輸出的模式至少包括語音模式。多模式瀏覽器典型地使得網頁用XHTML+Voice(‘X+V’)書寫。X+V提供使得用戶能夠通過除了諸如鍵盤敲擊和鼠標動作的傳統輸入手段以外的說話對話來與通常運行在服務器上的多模式數字音頻編輯器交互的標記語言。視覺標記告知多模式瀏覽器用戶界面的樣子以及當用戶敲擊、指點或點擊時其如何行動。類似地,話音標記告知多模式瀏覽器當用戶對其說話時其做什么。對于視覺標記,多模式瀏覽器使用圖形引擎;對于話音標記,多模式瀏覽器使用語音引擎。X+V通過集合XHTML(eXtensible?Hypertext?Markup?Language擴展超文本標記語言)和由VoiceXML支持的語音識別詞匯來添加對話交互到標準網頁內容中。對于視覺標記,X+V包括XHTML標準。對于話音標記,X+V包括VoiceXML的子集。對于同步VoiceXML元素與相應的視覺界面元素,X+V使用事件。XHTML包括支持語音同步、語音對話、命令和控制以及語音語法的話音模塊。話音處理器可以附于XHTML元素且響應具體事件。話音交互特征與XHTML集合,因此可以在XHTML內容中直接使用話音交互特征。
除了X+V以外,還可以用語音應用標簽(‘SALT’)來實現多模式數字音頻編輯器。SALT是由Salt?Forum開發的標記語言。X+V和SALT都是用于創建使用話音輸入/語音識別和話音輸出/語音合成的應用的標記語言。SALT應用和X+V應用都使用底層語音識別和合成技術或“語音引擎”來進行識別和生成人類語音的工作。作為標記語言,X+V和SALT都提供用于使用應用的用戶界面中的語音引擎的基于標記的編程環境。兩種語言都具有指定語音識別引擎應該監聽什么以及合成引擎應該“說”什么的語言元素、標記標簽。但是X+V組合XHTML、VoiceXML和XML事件標準來創建多模式數字音頻編輯器,SALT不提供標準視覺標記語言或事件模型。相反,它是用于指定能被嵌入其他環境中的話音交互的低級標簽組。除了X+V和SALT以外,可以使用例如Java語音框架的JavaTM、C++且使用其他技術以及在其他環境中實現多模式數字音頻編輯器。
當前的輕量話音解決方案需要開發者來建立語法和詞典,來限制自動化語音識別(‘ASR’)引擎必須識別的可能的詞量--作為用于增加準確度的手段。普遍的(pervasive)設備已經由于設備的形式因素而限制了交互和輸入形態,而站式(kiosk)設備已經通過設計限制了交互和輸入形態。在兩種情況下,實現使用說話者獨立的話音識別來增強與該設備的用戶體驗和交互。說話者獨立的識別中的現有技術的狀態允許寫入一些復雜的話音應用,只要存在與每個可能的話音命令相關聯的受限詞匯。例如,如果提示用戶說出城市名字,則系統能有良好的自信識別所說出的城市名字。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國際商業機器公司,未經國際商業機器公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810083001.1/2.html,轉載請聲明來源鉆瓜專利網。





