[發(fā)明專利]通過手勢識別的語音喚醒方法、智能電視及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201810185900.6 | 申請日: | 2018-03-07 |
| 公開(公告)號: | CN108271078A | 公開(公告)日: | 2018-07-10 |
| 發(fā)明(設(shè)計)人: | 林敏強;劉澤民;郭斌 | 申請(專利權(quán))人: | 康佳集團(tuán)股份有限公司 |
| 主分類號: | H04N21/472 | 分類號: | H04N21/472;G06F3/01;G06F3/0487;G06F3/16 |
| 代理公司: | 深圳市君勝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44268 | 代理人: | 王永文;劉文求 |
| 地址: | 518053 廣東省深圳市南山區(qū)高新*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 智能電視 攝像頭 預(yù)定操作 調(diào)用 手勢 語音識別操作 語音識別模塊 存儲介質(zhì) 手勢識別 用戶提供 喚醒 語音 指令 操作指令 技術(shù)實現(xiàn) 監(jiān)測圖像 手勢操作 有效解決 語音命令 麥克風(fēng) 短板 捕獲 | ||
本發(fā)明公開了通過手勢識別的語音喚醒方法、智能電視及存儲介質(zhì),其中,方法包括:預(yù)先在智能電視上設(shè)置用于獲取手勢操作的攝像頭,并設(shè)置攝像頭獲取的預(yù)定操作手勢與智能電視的操作指令對應(yīng),以及設(shè)置預(yù)定操作手勢與調(diào)用語音識別操作指令對應(yīng);智能電視的攝像頭監(jiān)測圖像信息,當(dāng)攝像頭捕獲到與調(diào)用語音識別操作指令對應(yīng)的預(yù)定操作手勢時,調(diào)用語音識別模塊;語音識別模塊控制打開麥克風(fēng)獲取對應(yīng)的語音命令,控制智能電視執(zhí)行相應(yīng)操作。本發(fā)明能有效解決語音喚醒的技術(shù)短板問題,為用戶提供方便,并且本發(fā)明可以有效降低技術(shù)實現(xiàn)成本,為用戶提供方便。
技術(shù)領(lǐng)域
本發(fā)明涉及智能電視技術(shù)領(lǐng)域,具體涉及一種通過手勢識別的語音喚醒方法、智能電視及存儲介質(zhì)。
背景技術(shù)
當(dāng)前的智能電視已經(jīng)普及語音識別應(yīng)用,可以通過語音進(jìn)行查詢、控制等操作。遠(yuǎn)場語音技術(shù)的引入,使得電視的人機交互完全脫離遙控器,直接通過語音喚醒后臺引擎,達(dá)到人機智能對話的效果。
現(xiàn)有技術(shù)方案的缺陷在于,算法需要對環(huán)境噪音、電視本身的聲音進(jìn)行消除,否則電視的聲音干擾目標(biāo)聲源的聲音拾音效果?,F(xiàn)有技術(shù)中的智能電視算法的缺陷在于當(dāng)電視音量超過一定限幅時,遠(yuǎn)超過目標(biāo)聲源的分貝,則喚醒的效果會大打折扣甚至無法喚醒。而且語音喚醒的算法需要對喚醒詞做大量的訓(xùn)練,訓(xùn)練成本高。
即現(xiàn)有技術(shù)中語音識別的電視開機時,用戶說出指定的喚醒詞,電視經(jīng)過拾音、消噪、消回聲(本機聲音)、與后臺訓(xùn)練的喚醒詞做識別匹配,當(dāng)識別結(jié)果正確時調(diào)用語音識別應(yīng)用的接口,從而實現(xiàn)之后的語音識別服務(wù)。
在實際使用中,正常人說話的音量在65dB左右,電視的最大音量可以達(dá)到140多dB,當(dāng)電視的音量遠(yuǎn)大于人說話的聲音時,一般超過20dB的情況下,麥克風(fēng)難以有效拾音,即使聲音增強算法上有所優(yōu)化,仍然無法滿足大音量條件下的語音喚醒使用需求。因此,現(xiàn)有的技術(shù)條件下,存在語音喚醒技術(shù)的瓶頸。
因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。
發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)的不足之處,本發(fā)明的目的在于提供一種通過手勢識別的語音喚醒方法、智能電視及存儲介質(zhì),本發(fā)明能有效解決語音喚醒的技術(shù)短板問題,為用戶提供方便,并且本發(fā)明可以有效降低技術(shù)實現(xiàn)成本。
為了達(dá)到上述目的,本發(fā)明采取了以下技術(shù)方案:
一種智能電視通過手勢識別的語音喚醒方法,其中,包括如下步驟:
A,預(yù)先在智能電視上設(shè)置用于獲取手勢操作的攝像頭,并設(shè)置攝像頭獲取的預(yù)定操作手勢與智能電視的操作指令對應(yīng),以及設(shè)置預(yù)定操作手勢與調(diào)用語音識別操作指令對應(yīng);
B,智能電視的攝像頭監(jiān)測圖像信息,當(dāng)攝像頭捕獲到與調(diào)用語音識別操作指令對應(yīng)的預(yù)定操作手勢時,調(diào)用語音識別模塊;
C、語音識別模塊控制打開麥克風(fēng)獲取對應(yīng)的語音命令,控制智能電視執(zhí)行相應(yīng)操作。
所述的智能電視通過手勢識別的語音喚醒方法,其中,所述步驟B還包括:
B10、當(dāng)攝像頭獲捕獲到與智能電視的操作指令對應(yīng)的預(yù)定操作手勢時,根據(jù)所述預(yù)定操作手勢控制智能電視執(zhí)行對應(yīng)的操作。
所述的智能電視通過手勢識別的語音喚醒方法,其中,所述步驟C具體包括:
C1、語音識別模塊控制麥克風(fēng)打開,對用戶語音命令進(jìn)行拾音操作;
C2、音頻數(shù)據(jù)反饋到語音識別模塊進(jìn)行處理;
C3、語音識別模塊將有效的指令提交至后臺識別引擎,由引擎返回識別結(jié)果;
C4、電視界面顯示結(jié)果或者響應(yīng)對應(yīng)識別結(jié)果的命令。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于康佳集團(tuán)股份有限公司,未經(jīng)康佳集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810185900.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
H04N 圖像通信,如電視
H04N21-00 可選的內(nèi)容分發(fā),例如交互式電視,VOD〔視頻點播〕
H04N21-20 .專門適用于內(nèi)容分發(fā)的專用服務(wù)器,例如:VOD服務(wù)器;其操作
H04N21-40 .專門適用于接收內(nèi)容或者與內(nèi)容交互的客戶端設(shè)備,如STB[機頂盒];相關(guān)操作
H04N21-60 .用于在服務(wù)器和客戶端之間或者在遠(yuǎn)程客戶端之間的視頻分配的網(wǎng)絡(luò)結(jié)構(gòu)或者處理
H04N21-80 .通過內(nèi)容產(chǎn)生器獨立于分配過程實現(xiàn)的內(nèi)容或附加數(shù)據(jù)的生成或處理;內(nèi)容本身
H04N21-81 ..其單媒體部件
- IDL調(diào)用裝置及調(diào)用方法
- 調(diào)用方法及調(diào)用系統(tǒng)
- 一種服務(wù)調(diào)用方法及裝置
- 服務(wù)調(diào)用方法、服務(wù)調(diào)用裝置及服務(wù)調(diào)用系統(tǒng)
- 組件調(diào)用方法、裝置及計算機可讀存儲介質(zhì)
- 身份驗證方法及裝置
- 系統(tǒng)調(diào)用處理方法、裝置、計算機設(shè)備和存儲介質(zhì)
- 一種數(shù)據(jù)調(diào)用方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種微服務(wù)請求重試的方法及終端
- 業(yè)務(wù)數(shù)據(jù)的處理方法、裝置及系統(tǒng)





