[發(fā)明專利]消費(fèi)類電子設(shè)備的音控方法和音控裝置有效

申請?zhí)枺?/td>	01131285.8	申請日：	2001-09-05
公開（公告）號：	CN1345029A	公開（公告）日：	2002-04-17
發(fā)明（設(shè)計）人：	恩斯特·F·施羅德;漢斯－約阿希姆·普拉特	申請（專利權(quán)）人：	湯姆森許可貿(mào)易公司
主分類號：	G10L15/00	分類號：	G10L15/00;G10L15/02
代理公司：	中科專利商標(biāo)代理有限責(zé)任公司	代理人：	戎志敏
地址：	法國***	國省代碼：	暫無信息
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	消費(fèi)類電子設(shè)備音控方法裝置
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

技術(shù)領(lǐng)域

本發(fā)明涉及消費(fèi)類電子設(shè)備的音控方法和音控裝置。

現(xiàn)有技術(shù)

利用音控方法可以簡化用戶對諸如電視機(jī)或錄像機(jī)的消費(fèi)類電子設(shè)備的操作控制。例如，已知利用音控方法改變設(shè)備設(shè)置、執(zhí)行操作控制功能，例如選臺，或?qū)崿F(xiàn)編程操作。

為此，最初將用戶說出的操作控制命令作為聲音信號進(jìn)行檢測、轉(zhuǎn)換為電信號然后進(jìn)行數(shù)字化。之后，將數(shù)字化音頻信號饋送到語音識別系統(tǒng)。在此，語音識別過程基于聲音模型和語音模型。聲音模型使用大量語音模式，語音模式利用指出與口語字在聲音上最匹配的字的數(shù)學(xué)算法。而語音模型是基于一種分析方法，這種分析方法是根據(jù)在此上下文中的大量文件采樣和通常特定字使用多么頻繁建立的。

當(dāng)前系統(tǒng)提供對著集成在遙控裝置上的麥克風(fēng)說操作控制命令。利用直接放在用戶口的前方的遙控裝置可以避免由背景噪聲的干擾引起的識別速率降低。然而，與在傳統(tǒng)遙控裝置情況下相同，仍要求用戶必須拿著遙控裝置。對于語音輸入，如果在消費(fèi)類電子設(shè)備內(nèi)設(shè)置一個或多個麥克風(fēng)，可以提高使用的方便性，因此，用戶可以在房間內(nèi)要求的任何位置實現(xiàn)操作控制，而無需拿著遙控裝置。在這種情況下，通過使用專用麥克風(fēng)陣列和諸如“統(tǒng)計聚束”或“盲源分離”的方法可以消除背景干擾。然而，所控制的設(shè)備不能確定當(dāng)前用戶在進(jìn)行哪個語音輸入。因此，不能僅對這些操作命令進(jìn)行響應(yīng)而忽略其它人的發(fā)音。

改善用戶使用方便性的進(jìn)一步方式是將電視節(jié)目自動緩沖存儲到集成在電視機(jī)或機(jī)頂盒內(nèi)的硬盤上。在對收視習(xí)慣分析之后，在這種情況下，自動記錄用戶先前有規(guī)律選擇的節(jié)目或節(jié)目類型。然后，如果用戶隨時接通其電視機(jī)，用戶可以以某個概率度觀看其喜歡的節(jié)目。然而，在有多個用戶情況下，由于不能識別在哪個時間是哪個用戶操作了電視機(jī)，所以會降低分析質(zhì)量。

發(fā)明內(nèi)容

本發(fā)明的目的是提供一種可以避免上述缺陷的音控方法。利用權(quán)利要求1所述的方法可以實現(xiàn)此目的。

原則上，消費(fèi)類電子設(shè)備的音控方法包括：將用戶語音輸入轉(zhuǎn)換為數(shù)字音頻信號。從數(shù)字音頻信號內(nèi)提取第一特性，第一特性表示語音的獨立聲音特征并可以識別口音。此外，從數(shù)字音頻信號內(nèi)提取第二特性，第二特性表示各用戶的語音特征并對不同用戶的語音輸入進(jìn)行識別。在第一用戶說過語音命令之后，通過檢驗表示特征語音特性的更多的語音輸入，僅可以從此第一用戶接收更多的語音命令，并且，如果根據(jù)這些特性可以將它們指定到同一個發(fā)音者，則只接收它們。

然后，就可以保證在給定周期內(nèi)，只有多個同時用戶中的一個用戶可以操作音控方法所涉及的設(shè)備，這與多個用戶中只有一個用戶具有匹配的遙控裝置的情況相同。

具體地說，其優(yōu)勢在于，從任何一個第一用戶接收用于接通設(shè)備的語音命令，此后，只從被接受的第一用戶輸入語音命令。

最好僅從第一用戶接收用于斷開該設(shè)備的語音命令，斷開此設(shè)備后，可以再從其他用戶接收語音命令。

然而，對于特定應(yīng)用，其優(yōu)勢在于，可以從任何用戶接收斷開該設(shè)備的語音命令。

同樣，優(yōu)勢在于，在第一用戶輸入操作控制命令后，提供允許從第二用戶接收語音命令的操作控制命令。這樣在將遙控裝置從第一用戶傳遞到第二用戶時，就可以將操作控制特權(quán)從第一用戶傳遞到第二用戶。

其顯著優(yōu)勢在于，為了對收視習(xí)慣進(jìn)行分析并根據(jù)此分析建立各種用戶的用戶描述，可以識別出現(xiàn)的各種用戶。

以這種方式獲得的用戶描述最好用于電視節(jié)目的緩沖存儲，以使不同用戶的優(yōu)選節(jié)目具有獨立緩沖存儲。

同樣，用戶描述可以用于對將收視的、適于各種用戶收視習(xí)慣的節(jié)目提供建議。

附圖的簡要說明

以下將參考附圖說明本發(fā)明的典型實施例，附圖包括：

圖1示出為了僅從某個用戶接收未來語音命令而在各種用戶的語音命令之間進(jìn)行識別的方法順序的示意圖；

圖2示出為了根據(jù)此識別建立各種用戶的用戶描述而識別各種用戶的方法順序的示意圖。

實施例

圖1示出第一實施例的順序的流程圖。對于音控電視機(jī)，為了僅從某個用戶接收未來語音輸入，在各種用戶的語音輸入之間進(jìn)行識別。

首先，在第一方法步驟1，將聲音信號轉(zhuǎn)換為電信號以產(chǎn)生模擬音頻信號，然后將音頻信號轉(zhuǎn)換為數(shù)字音頻信號。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于湯姆森許可貿(mào)易公司，未經(jīng)湯姆森許可貿(mào)易公司許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/01131285.8/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：光拾取裝置和傾斜量檢測方法
下一篇：具有回掃電容性轉(zhuǎn)換的偏轉(zhuǎn)電路

同類專利

專利分類

G 物理

G10 樂器；聲學(xué)
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創(chuàng)建基準(zhǔn)模板；訓(xùn)練語音識別系統(tǒng)，例如對說話者聲音特征的適應(yīng)
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環(huán)境

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實用新型專利、外觀設(shè)計專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點擊【登陸】【注冊】