[發明專利]交互式語音識別無效
| 申請號: | 201210462722.X | 申請日: | 2012-11-16 |
| 公開(公告)號: | CN102915733A | 公開(公告)日: | 2013-02-06 |
| 發明(設計)人: | M.S.B.塞加爾;M.M.拉扎 | 申請(專利權)人: | 微軟公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 董寧;汪揚 |
| 地址: | 美國華*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 交互式 語音 識別 | ||
背景技術
電子設備用戶逐漸依賴于從因特網獲取的信息作為新聞報道、評級、物品描述、公告、事件信息以及用戶可能感興趣的其他各類信息的來源。此外,用戶逐漸依賴于自動語音識別系統減輕在針對諸如搜索、請求地圖(map)、請求自動撥號電話呼叫和發短信(texting)等應用手動輸入文本時遇到的困難。
發明內容
根據一個一般方面,一種有形地包含在計算機可讀存儲介質中的計算機程序產品可以包括能夠使至少一個數據處理裝置獲取與第一話語(utterance)關聯的音頻數據的可執行代碼。進一步地,所述至少一個數據處理裝置可根據與所述音頻數據關聯的音頻信號分析,通過設備處理器獲取與所述第一話語的第一語音到文本轉化關聯的文本結果,所述文本結果包括多個對應于至少一個單詞的可選文本替代。進一步地,所述至少一個數據處理裝置可以啟動顯示包括文本替代中第一個的文本結果的至少一部分。進一步地,所述至少一個數據處理裝置可以接收指示文本替代中第二個的選擇指示。
根據另一方面,可以獲取與第一話語關聯的第一多個音頻特征。可根據與所述音頻特征關聯的音頻信號分析,獲取與所述第一話語的第一語音到文本轉化關聯的第一文本結果,所述第一文本結果包括至少一個第一單詞。可獲取與關聯于至少一個第一單詞的第一語音到文本轉化的至少第一部分相關的第一組音頻特征。可啟動顯示包括至少一個第一單詞的第一文本結果的至少一部分。可接收指示第一語音到文本轉化中錯誤的選擇指示,所述錯誤與至少一個第一單詞關聯。
根據另一方面,一種系統可以包括輸入獲取組件,所述組件獲取與第一話語關聯的第一多個音頻特征。所述系統還可以包括語音轉文本組件,所述組件根據與音頻特征關聯的音頻信號分析,通過設備處理器獲取與所述第一話語的第一語音到文本轉化關聯的第一文本結果,所述第一文本結果包括至少一個第一單詞。所述系統還可以包括片段(clip)相關組件,所述組件獲取第一多個音頻特征的第一相關部分,所述第一相關部分與第一語音到文本轉化到至少一個第一單詞關聯。所述系統還可以包括結果遞送組件,所述組件啟動輸出第一文本結果和第一多個音頻特征的第一相關部分。所述系統還可以包括校正請求獲取組件,所述組件獲取包括有關至少一個第一單詞是第一語音到文本轉化錯誤的指示,以及第一多個音頻特征的第一相關部分的校正請求。
本發明內容以簡單的形式介紹了一系列概念,這些概念將在具體實施方式中進一步描述。本發明內容不旨在識別所要保護的主題的關鍵特征或必要特征,不旨在用于限定所要保護的主題的范圍。下面的附圖和描述將闡述一個或多個實現細節。根據描述、附圖以及權利要求,其他特征將變得顯而易見。
附圖說明
圖1是用于交互式語音識別的系統實例的方框圖。
圖2a-2b是示出圖1中系統的實例操作的流程圖。
圖3a-3b是示出圖1中系統的實例操作的流程圖。
圖4?a-4c是示出圖1中系統的實例操作的流程圖。
圖5描繪與圖1中系統的實例交互。
圖6描繪與圖1中系統的實例交互。
圖7描繪與圖1中系統的實例交互。
圖8描繪與圖1中系統的實例交互。
圖9描繪與圖1中系統的實例交互。
圖10a-10c描繪圖1中系統的實例用戶接口。
具體實施方式
當電子設備用戶逐漸依賴于從設備本身或因特網獲取的信息時,他們也在逐漸依賴于自動語音識別系統減輕在針對諸如搜索、請求地圖、請求自動撥號電話呼叫和發短信等許多應用手動輸入文本時遇到的困難。
例如,從用戶角度來看,用戶可能希望對著移動設備說出一個或多個單詞并幾乎立即通過該移動設備接收到結果。例如,移動設備可以在用戶說出(多個)單詞時接收語音信號,并且既可以在設備本身上處理語音信號,也可以將語音信號(或從語音信號提取的預處理的音頻特征)發送到一個或多個其他設備(例如,后端服務器或“云”)進行處理。識別引擎然后可以識別信號并將相應文本發送到設備。如果所述識別引擎對用戶話語的一個或多個單詞進行錯誤分類(例如,返回用戶所說的一個或多個單詞的同音異義詞或近同音異義詞),則用戶希望避免再次說出他/她之前話語的所有單詞,或者避免說出不同的單詞或短語以希望該識別能夠通過不同的(多個)單詞識別出用戶的意圖,或者避免再次手動輸入文本來替代對語音識別的依賴。
此處討論的實例技術可以根據音頻片段與對應于由語音信號(例如,音頻特征)對應的相關音頻數據部分轉化而來的各單詞或短語的話語部分的關聯來提供語音轉文字識別?。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于微軟公司,未經微軟公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210462722.X/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:高壓靜電生物育種技術
- 下一篇:由雙輔翼構成的軸流風機葉輪葉片





