[發(fā)明專利]一種語音控制方法和控制設(shè)備有效
| 申請?zhí)枺?/td> | 201610006363.5 | 申請日: | 2013-05-29 |
| 公開(公告)號: | CN105513596B | 公開(公告)日: | 2020-03-27 |
| 發(fā)明(設(shè)計)人: | 劉智輝;喬寧博 | 申請(專利權(quán))人: | 華為技術(shù)有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L21/0208;G10L25/78 |
| 代理公司: | 廣州三環(huán)專利商標(biāo)代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518129 廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 控制 方法 設(shè)備 | ||
本發(fā)明實施例提供一種語音控制方法和控制設(shè)備,涉及通信領(lǐng)域,能夠在語音控制場景下接收到其他會場的聲音信息,并簡化了會議控制方式,提升了語音識別的效果。其方法為:通過接收本地會場的語音控制請求信號,啟用語音控制模式,對本地會場的語音信號和遠(yuǎn)端會場的語音信號進(jìn)行雙講檢測,獲取雙講檢測結(jié)果,雙講檢測結(jié)果為近端單講,或遠(yuǎn)端單講,或雙講,根據(jù)雙講檢測結(jié)果,確定本地會場中揚聲器的音量,并在雙講檢測結(jié)果為近端單講或所雙講時,對本地會場獲取的語音數(shù)據(jù)進(jìn)行語音識別,獲取語音識別結(jié)果,進(jìn)而從語音識別結(jié)果中獲取會控操作指令,并根據(jù)會控操作指令執(zhí)行相應(yīng)的會控操作。本發(fā)明實施例用于會議中進(jìn)行語音控制。
技術(shù)領(lǐng)域
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種語音控制方法和控制設(shè)備。
背景技術(shù)
在現(xiàn)有會議電話場景下,可以通過按鍵、Web等實現(xiàn)會控操作,解決了會議電話在會議中實現(xiàn)語音會控不便的問題,但是操作起來不太方便。語音識別技術(shù)可以使得語音控制簡化復(fù)雜的會議控制方式,例如Cisco(思科)有語音助手類的產(chǎn)品,但主要用于會議互通之前,輔助完成語音呼叫,查看郵件等操作,并沒有在會議中進(jìn)行語音控制的方案。
另外,非本地會場的聲音會影響語音識別的效果,而在現(xiàn)有的技術(shù)方案中,大多在進(jìn)行語音控制的時候,本地會場可以通過按鍵或者撥號等觸發(fā)方式,向MCU(MultipointControl Unit,多點控制單元)請求進(jìn)入語音識別模式,MCU將本地會場閉音,即停止發(fā)送其他會場的聲音到本地會場,終止IVR(Interactive Voice Response,交互式語音應(yīng)答)等語音相關(guān)操作,本地會場再接收控制語音數(shù)據(jù)到MCU的語音識別單元,該語音識別單元進(jìn)行語音識別后使得MCU執(zhí)行相應(yīng)的會控操作,在此過程中,MCU會把非本地會場送入的聲音屏蔽,即采用對本地?fù)P聲器閉音的方式,以減少其他會場對本地會場語音控制的干擾。上述實現(xiàn)過程存在的問題是,在這種會控模式下,將無法接收到非本地會場的任何聲音,本地會場的用戶可能就會獲取不到關(guān)鍵會議信息。
發(fā)明內(nèi)容
本發(fā)明的實施例提供一種語音控制方法和控制設(shè)備,能夠在語音控制場景下接收到其他會場的聲音信息,并簡化了會議控制方式,提升了語音識別的效果。
為達(dá)到上述目的,本發(fā)明的實施例采用如下技術(shù)方案:
第一方面,提供一種語音控制方法,包括:
接收本地會場的語音控制請求信號,啟用語音控制模式;
對所述本地會場的語音信號和遠(yuǎn)端會場的語音信號進(jìn)行雙講檢測,獲取雙講檢測結(jié)果,所述雙講檢測結(jié)果為近端單講,或遠(yuǎn)端單講,或雙講;
根據(jù)所述雙講檢測結(jié)果,確定所述本地會場中揚聲器的音量,并在所述雙講檢測結(jié)果為所述近端單講或所述雙講時,對所述本地會場獲取的語音數(shù)據(jù)進(jìn)行語音識別,獲取語音識別結(jié)果;
從所述語音識別結(jié)果中獲取會控操作指令,并根據(jù)所述會控操作指令執(zhí)行相應(yīng)的會控操作。
結(jié)合第一方面,在第一方面的第一種可能實現(xiàn)的方式中,所述通過對所述本地會場的語音信號和遠(yuǎn)端會場的語音信號進(jìn)行雙講檢測,獲取雙講檢測結(jié)果包括:
判斷所述本地會場和所述遠(yuǎn)端會場的回聲能量是否大于所述本地會場和所述遠(yuǎn)端會場的回聲抵消輸出能量的兩倍與第一閾值的和;
若所述回聲能量不大于所述回聲抵消輸出能量的兩倍與所述第一閾值的和,根據(jù)所述回聲能量是否小于所述本地會場的背景噪聲能量的兩倍與第二閾值的和判斷所述本地會場是否講話;
若所述回聲能量不小于所述背景噪聲能量的兩倍與所述第二閾值的和,則所述本地會場講話,并根據(jù)所述遠(yuǎn)端會場的參考信號是否小于通過所述語音活動偵測獲取的遠(yuǎn)端噪音能量的兩倍與第三閾值的和判斷所述遠(yuǎn)端會場是否講話,所述參考信號為所述遠(yuǎn)端會場的語音信號經(jīng)網(wǎng)絡(luò)傳輸還未經(jīng)過所述本地會場的揚聲器播放的語音信號;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華為技術(shù)有限公司,未經(jīng)華為技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610006363.5/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 傳感設(shè)備、檢索設(shè)備和中繼設(shè)備
- 簽名設(shè)備、檢驗設(shè)備、驗證設(shè)備、加密設(shè)備及解密設(shè)備
- 色彩調(diào)整設(shè)備、顯示設(shè)備、打印設(shè)備、圖像處理設(shè)備
- 驅(qū)動設(shè)備、定影設(shè)備和成像設(shè)備
- 發(fā)送設(shè)備、中繼設(shè)備和接收設(shè)備
- 定點設(shè)備、接口設(shè)備和顯示設(shè)備
- 傳輸設(shè)備、DP源設(shè)備、接收設(shè)備以及DP接受設(shè)備
- 設(shè)備綁定方法、設(shè)備、終端設(shè)備以及網(wǎng)絡(luò)側(cè)設(shè)備
- 設(shè)備、主設(shè)備及從設(shè)備
- 設(shè)備向設(shè)備轉(zhuǎn)發(fā)





