[發(fā)明專利]聲音識別方法、交互方法、聲音識別系統(tǒng)、計算機可讀存儲介質(zhì)及可移動平臺在審
| 申請?zhí)枺?/td> | 201980009292.6 | 申請日: | 2019-05-15 |
| 公開(公告)號: | CN111684522A | 公開(公告)日: | 2020-09-18 |
| 發(fā)明(設(shè)計)人: | 吳俊峰;趙文泉;李皓宇;周事成;吳晟 | 申請(專利權(quán))人: | 深圳市大疆創(chuàng)新科技有限公司 |
| 主分類號: | G10L25/51 | 分類號: | G10L25/51;G10L25/03 |
| 代理公司: | 北京博思佳知識產(chǎn)權(quán)代理有限公司 11415 | 代理人: | 艾佳 |
| 地址: | 518057 廣東省深圳市南山區(qū)高*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 聲音 識別 方法 交互 系統(tǒng) 計算機 可讀 存儲 介質(zhì) 移動 平臺 | ||
本申請公開一種聲音識別方法、交互方法、聲音識別系統(tǒng)、計算機可讀存儲介質(zhì)及可移動平臺。聲音識別方法用于識別拍擊聲音。聲音識別方法包括:獲取待識別聲音信號的至少一個聲音片段和聲音片段的第一特征信息,第一特征信息為聲音片段的能量值,若聲音片段的中部區(qū)域的能量值大于能量閾值,則從聲音片段中提取第二特征信息;及根據(jù)至少一個聲音片段的第二特征信息,識別待識別聲音信號是否包括拍擊聲音。
技術(shù)領(lǐng)域
本申請涉及聲音識別領(lǐng)域,尤其涉及一種聲音識別方法、交互方法、聲音識別系統(tǒng)、計算機可讀存儲介質(zhì)及可移動平臺。
背景技術(shù)
隨著智能硬件在家居生活、教育等應(yīng)用場合的普及,聲音逐漸成為一種重要的人機交互方式,例如語音交互。但是,受制于硬件限制,當(dāng)距離較遠(yuǎn)時,例如,當(dāng)距離硬件設(shè)備2米以上時,由于信噪比較低,在語音信號中混雜的環(huán)境噪聲會給語音識別帶來很大的挑戰(zhàn)。與語音信號相比,拍擊聲音信號單一,具有更強的抗干擾能力,且瞬時能量更強。因此可以利用拍擊聲音,例如掌聲等,控制硬件設(shè)備,例如聲控開關(guān)。然而,現(xiàn)有的基于波形比較電路的聲控開關(guān),在使用中魯棒性不足,高音量的聲音大多都能將其觸發(fā),誤觸發(fā)過于頻繁,作為人機交互方式不可靠。
發(fā)明內(nèi)容
本申請?zhí)峁└倪M(jìn)的聲音識別方法、交互方法、聲音識別系統(tǒng)、計算機可讀存儲介質(zhì)及可移動平臺。
根據(jù)本申請實施例的一個方面,提供一種聲音識別方法,用于識別拍擊聲音,聲音識別方法包括:獲取待識別聲音信號的至少一個聲音片段和所述聲音片段的第一特征信息,所述第一特征信息為所述聲音片段的能量值,若所述聲音片段的中部區(qū)域的能量值大于能量閾值,則從所述聲音片段中提取第二特征信息;及根據(jù)至少一個所述聲音片段的所述第二特征信息,識別所述待識別聲音信號是否包括拍擊聲音。
根據(jù)本申請實施例的一個方面,提供一種交互方法,包括:獲取待識別聲音信號;聲音識別方法;及若根據(jù)所述聲音識別方法識別出所述待識別聲音信號包括拍擊聲音,根據(jù)所述拍擊聲音輸出相應(yīng)的控制指令。
根據(jù)本申請實施例的另一個方面,提供一種聲音識別系統(tǒng),包括一個或多個處理器,用于實現(xiàn)聲音識別方法。
根據(jù)本申請實施例的另一個方面,提供一種計算機可讀存儲介質(zhì),其上存儲有程序,該程序被處理器執(zhí)行時,實現(xiàn)聲音識別方法。
根據(jù)本申請實施例的另一個方面,提供一種可移動平臺,包括:機體;動力系統(tǒng),設(shè)于所述機體,用于為所述可移動平臺提供動力;麥克風(fēng),用于接收待識別聲音,并產(chǎn)生相應(yīng)的待識別聲音信號;及一個或多個處理器,用于實現(xiàn)聲音識別方法,并若根據(jù)所述聲音識別方法識別出所述待識別聲音信號包括拍擊聲音,則根據(jù)所述拍擊聲音輸出相應(yīng)的控制指令。
本申請實施例聲音識別方法中,若所述聲音片段的中部區(qū)域的能量值大于能量閾值,則從聲音片段中提取第二特征信息,如此對待識別聲音信號進(jìn)行初篩,進(jìn)而根據(jù)第二特征信息識別待識別聲音信號是否包括拍擊聲音,從而在較遠(yuǎn)的距離范圍內(nèi),拍擊聲音的識別率高,魯棒性好,誤觸發(fā)可能性低,適合作為一種可靠的人機交互方式。
附圖說明
為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1所示為本申請聲音識別方法的一個實施例的流程圖。
圖2所示為本申請聲音識別方法的一個實施例的子流程圖。
圖3所示為本申請交互方法的一個實施例的流程圖。
圖4所示為本申請聲音識別系統(tǒng)的一個實施例的示意圖。
圖5所示為本申請可移動平臺的一個實施例的模塊框圖。
具體實施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳市大疆創(chuàng)新科技有限公司,未經(jīng)深圳市大疆創(chuàng)新科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201980009292.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





