[發明專利]依賴于文本信息語境的語音識別無效

申請號：	201210081427.X	申請日：	2012-03-26
公開（公告）號：	CN102693725A	公開（公告）日：	2012-09-26
發明（設計）人：	G.塔爾瓦;X.趙	申請（專利權）人：	通用汽車有限責任公司
主分類號：	G10L15/26	分類號：	G10L15/26;G10L15/28;G10L15/08
代理公司：	中國專利代理(香港)有限公司 72001	代理人：	劉楨;楊楷
地址：	美國密***	國省代碼：	美國;US
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	依賴于文本信息語境語音識別
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種自動語音識別方法，包括下列步驟：

a)?通過麥克風從用戶接收對文本信息的回復話語，所述麥克風將所述回復話語轉換為語音信號；

b)?使用至少一個處理器來預處理所述語音信號，以從所述語音信號提取聲音數據；

c)?使用與所述文本信息相關的會話語境來識別多個聲音模型中的一個聲音模型，以解碼所述聲音數據；以及

d)?使用識別的聲音模型來解碼所述聲音數據，以產生用于所述回復話語的多個假設。

2.如權利要求1的方法，還包括如下步驟：

e)?后處理所述多個假設，以將所述假設中的一個識別為所述回復話語。

3.如權利要求2的方法，還包括如下步驟：

f)?將所述識別的假設展現給用戶；

g)?從用戶尋求所述識別的假設為正確的確認；以及

h)?如果用戶確定所述識別的假設是正確的，那么輸出所述識別的假設作為回復文本信息的至少一部分。

4.如權利要求3的方法，還包括如下步驟：

i)?處理所述文本信息，利用會話語境特定的語言模型識別對應于所述文本信息的會話語境，以及利用情感語境特定的語言模型識別對應于所述文本信息的情感語境，其中所述語言模型存儲在客戶端裝置上；以及

j)?使用所述情感語境來完善所述聲音模型的識別。

5.如權利要求2的方法，還包括如下步驟：

f)?利用識別的假設來改編所述多個聲音模型，用以隨時間完善語音識別性能。

6.如權利要求5的方法，其中步驟a)和b)在語音識別客戶端裝置上執行，步驟c)至f)在語音識別服務器上執行。

7.如權利要求6的方法，其中改編步驟f)還包括使用所述識別的假設改編存儲在所述服務器上的多個語境特定的語言模型，和將所述多個語境特定的語言模型從所述服務器發送至所述客戶端裝置，以更新存儲在所述客戶端裝置上的語言模型，用以隨時間改善文本信息語境分類。

8.如權利要求6的方法，還包括如下步驟：

在所述語音識別客戶端裝置接收文本信息；

處理所述文本信息，利用會話語境特定的語言模型來識別對應于所述文本信息的會話語境，和利用情感語境特定的語言模型來識別對應于所述文本信息的情感語境，其中所述語言模型存儲在客戶端裝置上；以及

發送所述識別的會話和情感語境至所述語音識別服務器。

9.一種自動語音識別方法，包括如下步驟：

a)?在語音識別客戶端裝置接收文本信息；?

b)?使用所述客戶端裝置的至少一個處理器通過存儲在所述客戶端裝置上的會話語境特定的語言模型來處理所述文本信息，以識別對應于所述文本信息的會話語境；

c)?從所述文本信息合成語音；

d)?通過所述客戶端裝置的揚聲器將所述合成的語音發送至所述客戶端裝置的用戶；

e)?通過所述客戶端裝置的麥克風從用戶接收回復話語，所述麥克風將所述回復話語轉換為語音信號；

f)?使用至少一個處理器來預處理所述語音信號，以從所述接收的語音信號提取聲音數據；

g)?將所述提取的聲音數據和識別的會話語境發送至語音識別服務器；

h)?使用識別的會話語境來識別存儲在所述服務器上的多個聲音模型中的一個聲音模型，以解碼所述聲音數據；

i)?使用識別的聲音模型來解碼所述聲音數據，以產生用于所述回復話語的多個假設；以及

j)?后處理所述多個假設，以將所述假設之一識別為所述回復話語。

10.一種自動語音識別方法，包括如下步驟：

a)?在語音識別客戶端裝置接收文本信息；?

c)?從所述文本信息合成語音；

d)?通過所述客戶端裝置的揚聲器發送所述合成的語音至所述客戶端裝置的用戶；

e)?通過所述客戶端裝置的麥克風從用戶接收回復話語，所述麥克風將所述回復話語轉換為語音信號；

f)?使用至少一個處理器預處理所述語音信號，以從接收的語音信號提取聲音數據；

g)?使用識別的與所述文本信息相關的會話語境，識別所述多個聲音模型中的一個聲音模型，以解碼所述聲音數據；

h)?使用識別的聲音模型解碼所述聲音數據，以產生用于所述回復話語的多個假設；

i)?確定與所述回復話語的多個假設的至少一個相關的信任值是否大于或小于信任閾值；

j)?如果所述信任值被確定為小于所述信任閾值，那么將提取的聲音數據和會話語境發送至語音識別服務器，否則后處理所述多個假設，以將所述假設之一識別為所述回復話語，并從所述客戶端裝置輸出所述識別的假設作為回復的文本信息的至少一部分；

k)?使用識別的會話語境在所述服務器識別存儲在所述服務器的多個聲音模型中的一個聲音模型，以解碼所述聲音數據；

l)?使用在所述服務器識別的所述聲音模型解碼所述聲音數據，以產生用于所述回復話語的多個假設；

m)?后處理所述多個假設，以將所述假設之一識別為所述回復話語；以及

n)?從所述服務器輸出所述識別的假設作為回復的文本信息的至少一部分。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于通用汽車有限責任公司，未經通用汽車有限責任公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/201210081427.X/1.html，轉載請聲明來源鉆瓜專利網。

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】