[發明專利]依賴于文本信息語境的語音識別無效
| 申請號: | 201210081427.X | 申請日: | 2012-03-26 |
| 公開(公告)號: | CN102693725A | 公開(公告)日: | 2012-09-26 |
| 發明(設計)人: | G.塔爾瓦;X.趙 | 申請(專利權)人: | 通用汽車有限責任公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/28;G10L15/08 |
| 代理公司: | 中國專利代理(香港)有限公司 72001 | 代理人: | 劉楨;楊楷 |
| 地址: | 美國密*** | 國省代碼: | 美國;US |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 依賴于 文本 信息 語境 語音 識別 | ||
1.一種自動語音識別方法,包括下列步驟:
a)?通過麥克風從用戶接收對文本信息的回復話語,所述麥克風將所述回復話語轉換為語音信號;
b)?使用至少一個處理器來預處理所述語音信號,以從所述語音信號提取聲音數據;
c)?使用與所述文本信息相關的會話語境來識別多個聲音模型中的一個聲音模型,以解碼所述聲音數據;以及
d)?使用識別的聲音模型來解碼所述聲音數據,以產生用于所述回復話語的多個假設。
2.如權利要求1的方法,還包括如下步驟:
e)?后處理所述多個假設,以將所述假設中的一個識別為所述回復話語。
3.如權利要求2的方法,還包括如下步驟:
f)?將所述識別的假設展現給用戶;
g)?從用戶尋求所述識別的假設為正確的確認;以及
h)?如果用戶確定所述識別的假設是正確的,那么輸出所述識別的假設作為回復文本信息的至少一部分。
4.如權利要求3的方法,還包括如下步驟:
i)?處理所述文本信息,利用會話語境特定的語言模型識別對應于所述文本信息的會話語境,以及利用情感語境特定的語言模型識別對應于所述文本信息的情感語境,其中所述語言模型存儲在客戶端裝置上;以及
j)?使用所述情感語境來完善所述聲音模型的識別。
5.如權利要求2的方法,還包括如下步驟:
f)?利用識別的假設來改編所述多個聲音模型,用以隨時間完善語音識別性能。
6.如權利要求5的方法,其中步驟a)和b)在語音識別客戶端裝置上執行,步驟c)至f)在語音識別服務器上執行。
7.如權利要求6的方法,其中改編步驟f)還包括使用所述識別的假設改編存儲在所述服務器上的多個語境特定的語言模型,和將所述多個語境特定的語言模型從所述服務器發送至所述客戶端裝置,以更新存儲在所述客戶端裝置上的語言模型,用以隨時間改善文本信息語境分類。
8.如權利要求6的方法,還包括如下步驟:
在所述語音識別客戶端裝置接收文本信息;
處理所述文本信息,利用會話語境特定的語言模型來識別對應于所述文本信息的會話語境,和利用情感語境特定的語言模型來識別對應于所述文本信息的情感語境,其中所述語言模型存儲在客戶端裝置上;以及
發送所述識別的會話和情感語境至所述語音識別服務器。
9.一種自動語音識別方法,包括如下步驟:
a)?在語音識別客戶端裝置接收文本信息;?
b)?使用所述客戶端裝置的至少一個處理器通過存儲在所述客戶端裝置上的會話語境特定的語言模型來處理所述文本信息,以識別對應于所述文本信息的會話語境;
c)?從所述文本信息合成語音;
d)?通過所述客戶端裝置的揚聲器將所述合成的語音發送至所述客戶端裝置的用戶;
e)?通過所述客戶端裝置的麥克風從用戶接收回復話語,所述麥克風將所述回復話語轉換為語音信號;
f)?使用至少一個處理器來預處理所述語音信號,以從所述接收的語音信號提取聲音數據;
g)?將所述提取的聲音數據和識別的會話語境發送至語音識別服務器;
h)?使用識別的會話語境來識別存儲在所述服務器上的多個聲音模型中的一個聲音模型,以解碼所述聲音數據;
i)?使用識別的聲音模型來解碼所述聲音數據,以產生用于所述回復話語的多個假設;以及
j)?后處理所述多個假設,以將所述假設之一識別為所述回復話語。
10.一種自動語音識別方法,包括如下步驟:
a)?在語音識別客戶端裝置接收文本信息;?
b)?使用所述客戶端裝置的至少一個處理器通過存儲在所述客戶端裝置上的會話語境特定的語言模型來處理所述文本信息,以識別對應于所述文本信息的會話語境;
c)?從所述文本信息合成語音;
d)?通過所述客戶端裝置的揚聲器發送所述合成的語音至所述客戶端裝置的用戶;
e)?通過所述客戶端裝置的麥克風從用戶接收回復話語,所述麥克風將所述回復話語轉換為語音信號;
f)?使用至少一個處理器預處理所述語音信號,以從接收的語音信號提取聲音數據;
g)?使用識別的與所述文本信息相關的會話語境,識別所述多個聲音模型中的一個聲音模型,以解碼所述聲音數據;
h)?使用識別的聲音模型解碼所述聲音數據,以產生用于所述回復話語的多個假設;
i)?確定與所述回復話語的多個假設的至少一個相關的信任值是否大于或小于信任閾值;
j)?如果所述信任值被確定為小于所述信任閾值,那么將提取的聲音數據和會話語境發送至語音識別服務器,否則后處理所述多個假設,以將所述假設之一識別為所述回復話語,并從所述客戶端裝置輸出所述識別的假設作為回復的文本信息的至少一部分;
k)?使用識別的會話語境在所述服務器識別存儲在所述服務器的多個聲音模型中的一個聲音模型,以解碼所述聲音數據;
l)?使用在所述服務器識別的所述聲音模型解碼所述聲音數據,以產生用于所述回復話語的多個假設;
m)?后處理所述多個假設,以將所述假設之一識別為所述回復話語;以及
n)?從所述服務器輸出所述識別的假設作為回復的文本信息的至少一部分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于通用汽車有限責任公司,未經通用汽車有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210081427.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:半導體裝置及其制造方法
- 下一篇:移動終端的內容管理方法和設備
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





