[發(fā)明專利]聲音行為檢測的方法和裝置在審
| 申請?zhí)枺?/td> | 201810083728.3 | 申請日: | 2018-01-29 |
| 公開(公告)號: | CN110098985A | 公開(公告)日: | 2019-08-06 |
| 發(fā)明(設(shè)計)人: | 郭云云 | 申請(專利權(quán))人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | H04L12/28 | 分類號: | H04L12/28;G10L15/22 |
| 代理公司: | 北京博浩百睿知識產(chǎn)權(quán)代理有限責(zé)任公司 11134 | 代理人: | 宋子良 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 開曼群島;KY |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語音指令 方法和裝置 采樣聲音 控制功能 判斷結(jié)果 聲音行為 依賴度 監(jiān)聽 檢測 | ||
本發(fā)明公開了一種聲音行為檢測的方法和裝置。其中,該方法包括:獲取采樣聲音;識別采樣聲音中的至少一個特征,并判斷至少一個特征是否存在對應(yīng)的控制功能;在判斷結(jié)果為是的情況下,執(zhí)行控制功能;在判斷結(jié)果為否的情況下,保持監(jiān)聽。本發(fā)明解決了由于現(xiàn)有技術(shù)在下達語音指令過程中對用戶話術(shù)方式描述的語音指令的依賴度太高,導(dǎo)致執(zhí)行語音指令過程中效率低的技術(shù)問題。
技術(shù)領(lǐng)域
本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)應(yīng)用領(lǐng)域,具體而言,涉及一種聲音行為檢測的方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,物聯(lián)網(wǎng)以及應(yīng)用于物聯(lián)網(wǎng)中的智能家居、智能汽車等領(lǐng)域也隨著發(fā)展,現(xiàn)有“智能”的標(biāo)準(zhǔn)大多停留在減少人工操作,以捕捉獲取用戶行為做預(yù)測,實現(xiàn)人工智能等等。
其中,以智能家居為例,用戶通過聲音指令控制家用電器,例如,以用戶進家門之后的系列行為為例,在開鎖的過程中,由智能門鎖檢測是否為用戶本人,在檢測結(jié)果為是的情況下,開門;當(dāng)用戶進入室內(nèi)時,如需要開燈,則通過說出“開燈”的語音指令,控制部分或全部燈開啟,如需打開空調(diào)和電視機,同樣以“打開空調(diào)”“打開電視”“調(diào)至26℃”“播放新聞”等語音指令控制開空調(diào)和電視機。
但是上述現(xiàn)有技術(shù)存在的缺陷則為需要用戶“清楚”“正確”的以話術(shù)的方式描述出家電所要執(zhí)行的控制動作,進而準(zhǔn)確的下達語音指令,對用戶依賴度太高,語音指令的執(zhí)行結(jié)果也會因為用戶下達的語音指令存在偏差,并且語音指令的下達會透露用戶對家電的控制方式,進而帶來相關(guān)的安全問題。
針對上述由于現(xiàn)有技術(shù)在下達語音指令過程中對用戶話術(shù)方式描述的語音指令的依賴度太高,導(dǎo)致執(zhí)行語音指令過程中效率低的問題,目前尚未提出有效的解決方案。
發(fā)明內(nèi)容
本發(fā)明實施例提供了一種聲音行為檢測的方法和裝置,以至少解決由于現(xiàn)有技術(shù)在下達語音指令過程中對用戶話術(shù)方式描述的語音指令的依賴度太高,導(dǎo)致執(zhí)行語音指令過程中效率低的技術(shù)問題。
根據(jù)本發(fā)明實施例的一個方面,提供了一種聲音檢測的方法,包括:獲取采樣聲音;識別采樣聲音中的至少一個特征,并判斷至少一個特征是否存在對應(yīng)的控制功能;在判斷結(jié)果為是的情況下,執(zhí)行控制功能;在判斷結(jié)果為否的情況下,保持監(jiān)聽。
可選的,在獲取采樣聲音之前,該方法還包括:監(jiān)聽當(dāng)前區(qū)域的所有聲音。
進一步地,可選的,獲取采樣聲音包括:判斷所有聲音中是否存在滿足預(yù)設(shè)發(fā)聲規(guī)律的聲音;在判斷結(jié)果為是的情況下,對滿足預(yù)設(shè)發(fā)聲規(guī)律的聲音進行采樣,得到采樣聲音。
可選的,判斷至少一個特征是否存在對應(yīng)的控制功能包括:在采樣聲音的特征包括音色、節(jié)奏、響度、次數(shù)或音調(diào)中一種或至少兩種的組合的情況下,判斷采樣聲音中的音色、節(jié)奏、響度、次數(shù)或音調(diào)中一種或至少兩種的組合是否存在對應(yīng)的控制功能。
可選的,在獲取采樣聲音之前,該方法還包括:依據(jù)接收到的歷史采樣聲音的特征進行學(xué)習(xí),分別依據(jù)歷史采樣聲音的特征匹配對應(yīng)的控制功能。
根據(jù)本發(fā)明實施例的一個方面,提供了另一種聲音行為檢測的方法,包括:獲取采樣聲音行為,其中,采樣聲音行為,用于指示產(chǎn)生當(dāng)前聲音所對應(yīng)的行為動作;依據(jù)采樣聲音行為中的至少一個特征判斷是否存在對應(yīng)的控制功能;在判斷結(jié)果為是的情況下,執(zhí)行控制功能;在判斷結(jié)果為否的情況下,保持監(jiān)聽。
可選的,獲取采樣聲音行為包括:通過聲音采集裝置和/或圖像采集裝置采集用戶的聲音行為;將聲音行為確定為采樣聲音行為;其中,采樣聲音行為為通過聲音采集裝置和/或圖像采集裝置采集到的產(chǎn)生聲音的用戶行為動作以及聲音。
根據(jù)本發(fā)明實施例的另一方面,還提供了一種聲音檢測的裝置,包括:獲取模塊,用于獲取采樣聲音;檢測模塊,用于識別采樣聲音中的至少一個特征,并判斷至少一個特征是否存在對應(yīng)的控制功能;第一執(zhí)行模塊,用于在判斷結(jié)果為是的情況下,執(zhí)行控制功能;第二執(zhí)行模塊,用于在判斷結(jié)果為否的情況下,保持監(jiān)聽。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于阿里巴巴集團控股有限公司,未經(jīng)阿里巴巴集團控股有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810083728.3/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





