[發(fā)明專利]車內(nèi)語音對話系統(tǒng)在審
| 申請?zhí)枺?/td> | 201110450005.0 | 申請日: | 2011-12-28 |
| 公開(公告)號: | CN103187061A | 公開(公告)日: | 2013-07-03 |
| 發(fā)明(設(shè)計)人: | 劉根華;廖建國;張曉海 | 申請(專利權(quán))人: | 上海博泰悅臻電子設(shè)備制造有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 駱蘇華 |
| 地址: | 200030 上海市徐匯區(qū)天鑰*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音 對話 系統(tǒng) | ||
1.一種車內(nèi)語音對話系統(tǒng),其特征在于,包括:
語音輸入單元,用于接收語音;
語音轉(zhuǎn)換單元,用于基于所述語音輸入單元接收的語音形成錄音文件,并從所述錄音文件中提取語音音素進(jìn)行識別,并基于識別出的語音音素形成語音特征信息;
存儲單元,用于存儲各種車載應(yīng)用場景所對應(yīng)的場景指令文本,以及各種場景下的應(yīng)用操作所對應(yīng)的操作指令文本;
指令識別單元,從存儲單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的場景指令文本,在搜索到匹配的場景指令文本時,形成對應(yīng)的場景啟動指令;以及從存儲單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本時,形成對應(yīng)的應(yīng)用操作指令;
應(yīng)用處理單元,在獲得對應(yīng)的場景啟動指令后啟動,并在獲得對應(yīng)的應(yīng)用操作指令后,執(zhí)行應(yīng)用操作。
2.如權(quán)利要求1所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述語音轉(zhuǎn)換單元包括:
語音識別庫,用于存儲語音音素;
錄音單元,用于接收所述語音輸入單元接收的語音,并形成錄音文件;
語音識別單元,從所述錄音文件中提取語音音素與所述語音識別庫中的語音音素進(jìn)行比對,在從所述語音識別庫中獲得匹配的語音音素時,基于所述匹配的語音音素對應(yīng)的詞條形成語音特征信息。
3.如權(quán)利要求2所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述語音識別單元包括:音素提取單元、音素比對單元及語音特征信息形成單元;
所述音素提取單元,用于從所述錄音文件中提取語音音素;
所述音素比對單元將所提取的語音音素與所述語音識別庫中的語音音素進(jìn)行比對,獲得相應(yīng)的比對結(jié)果;
所述語音特征信息形成單元,在比對結(jié)果的置信度大于預(yù)設(shè)置信度時,確定提取出的語音音素與所述語音識別庫中的相應(yīng)語音音素匹配,并基于所述相應(yīng)語音音素對應(yīng)的詞條形成語音特征信息。
4.如權(quán)利要求2或3所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述語音音素為語音波形。
5.如權(quán)利要求1所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述指令識別單元包括:場景識別單元及應(yīng)用操作識別單元;
場景識別單元,從存儲單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的場景指令文本,在搜索到匹配的場景指令文本時,形成對應(yīng)的場景啟動指令;
應(yīng)用操作識別單元,從存儲單元中搜索與語音轉(zhuǎn)換單元轉(zhuǎn)換的語音特征信息匹配的操作指令文本,在搜索到匹配的操作指令文本時,形成對應(yīng)的應(yīng)用操作指令。
6.如權(quán)利要求1所述的車內(nèi)語音對話系統(tǒng),其特征在于,還包括提示單元,在指令識別單元識別出所述場景指令文本或所述操作指令文本時,向用戶提示對應(yīng)所述場景指令文本或所述操作指令文本的反饋信息。
7.如權(quán)利要求6所述的車內(nèi)語音對話系統(tǒng),其特征在于,還包括應(yīng)答信息存儲單元,所述提示單元還根據(jù)用戶基于所述提示信息反饋的確認(rèn)信息,從所述應(yīng)答信息存儲單元中搜索與所述場景指令文本或所述操作指令文本對應(yīng)的應(yīng)答信息,并向用戶提示所述應(yīng)答信息。
8.如權(quán)利要求6所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述提示單元在指令識別單元未能搜索到匹配的場景指令文本或操作指令文本時,向用戶提示識別失敗的信息。
9.如權(quán)利要求6至8任一項(xiàng)所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述提示單元為語音播報單元。
10.如權(quán)利要求6至8任一項(xiàng)所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述提示單元為顯示單元。
11.如權(quán)利要求1所述的車內(nèi)語音對話系統(tǒng),其特征在于,還包括觸發(fā)單元,用于基于用戶的請求啟動所述車內(nèi)語音對話系統(tǒng)。
12.如權(quán)利要求11所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述觸發(fā)單元為觸發(fā)按鍵。
13.如權(quán)利要求11所述的車內(nèi)語音對話系統(tǒng),其特征在于,還包括計時單元,在所述車內(nèi)語音對話系統(tǒng)啟動后計時,在計時時間達(dá)到時間閾值且此期間語音輸入單元未接收到語音時,關(guān)閉所述車內(nèi)語音對話系統(tǒng)。
14.如權(quán)利要求1所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述車載應(yīng)用場景包括:電話場景、本地音樂播放場景、廣播場景、情景對話場景、預(yù)訂服務(wù)場景。
15.如權(quán)利要求1或13所述的車內(nèi)語音對話系統(tǒng),其特征在于,所述語音輸入單元為麥克風(fēng)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海博泰悅臻電子設(shè)備制造有限公司,未經(jīng)上海博泰悅臻電子設(shè)備制造有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110450005.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





