[發(fā)明專利]一種語音活動檢測的方法、電子設備及裝置有效
| 申請?zhí)枺?/td> | 202110500083.0 | 申請日: | 2021-05-08 |
| 公開(公告)號: | CN113223561B | 公開(公告)日: | 2023-03-24 |
| 發(fā)明(設計)人: | 何陳;葉順舟;康力;巴莉芳 | 申請(專利權(quán))人: | 紫光展銳(重慶)科技有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/84;G10L15/22 |
| 代理公司: | 廣州三環(huán)專利商標代理有限公司 44202 | 代理人: | 熊永強;李光金 |
| 地址: | 400700 重慶市*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 語音 活動 檢測 方法 電子設備 裝置 | ||
本申請公開一種語音活動檢測的方法、電子設備及裝置,該方法包括:獲取第一聲音信號和第二聲音信號,該第一聲音信號為空氣傳導麥克接收的聲音信號,該第二聲音信號為骨傳導麥克接收的聲音信號;確定該第一聲音信號的第一總能量以及該第二聲音信號的第二總能量;基于該第一總能量和第一聲音信號的第一預設噪音能量確定該第一聲音信號的第一語音能量;基于該第二總能量和第二聲音信號的第二預設噪音能量確定該第二聲音信號的第二語音能量;確定該第二語音能量是否大于第一閾值;若該第二語音能量大于該第一閾值,則基于該第一比值確定該第一聲音信號和該第二聲音信號中是否具有語音。采用本申請描述的方法,有利于提高檢測語音活動的準確性。
技術(shù)領(lǐng)域
本發(fā)明涉及通信領(lǐng)域,尤其涉及一種語音活動檢測的方法、電子設備及裝置。
背景技術(shù)
語音活動檢測(Voice activity detection,VAD)是對聲音信號的能量、過零率、諧波等特征進行分析,來判斷聲音信號中是否存在語音。VAD技術(shù)主要用于簡化語音處理。例如,在網(wǎng)際協(xié)議(Internet Protocol,IP)電話應用中不對靜音數(shù)據(jù)包進行編碼或者傳輸,從而有效節(jié)省計算時間和帶寬。
目前,市場上主要基于空氣傳導(AC,Air Conducted)麥克接收的空氣傳導信號來進行語音活動檢測,但空氣傳導信號往往面臨環(huán)境噪聲的影響,大量的噪聲會降低語音活動檢測的準確性。
發(fā)明內(nèi)容
本申請?zhí)峁┮环N語音活動檢測的方法、電子設備及裝置,有利于提高語音活動檢測的準確性。
第一方面,本申請?zhí)岢隽艘环N語音活動檢測的方法,該方法包括:獲取第一聲音信號和第二聲音信號,該第一聲音信號為空氣傳導麥克接收的聲音信號,該第二聲音信號為骨傳導麥克接收的聲音信號;確定該第一聲音信號的第一總能量以及該第二聲音信號的第二總能量;基于該第一總能量和第一聲音信號的第一預設噪音能量確定該第一聲音信號的第一語音能量;基于該第二總能量和第二聲音信號的第二預設噪音能量確定該第二聲音信號的第二語音能量;確定該第二語音能量是否大于第一閾值;若該第二語音能量大于該第一閾值,則基于第一比值確定該第一聲音信號和該第二聲音信號中是否具有語音,該第一比值為該第一語音能量和該第二語音能量的比值。
在一種可能的實現(xiàn)方式中,基于該第一比值確定該第一聲音信號和該第二聲音信號中是否具有語音時的具體實現(xiàn)方式為:確定第一比值是否大于或等于第二閾值,該第一比值為該第一語音能量和該第二語音能量的比值;若該第一比值大于或等于該第二閾值,則確定該第一聲音信號和該第二聲音信號中具有語音。
在一種可能的實現(xiàn)方式中,若該第一比值小于該第二閾值,則確定該第一聲音信號和該第二聲音信號中不具有語音;基于平滑因子、該第一總能量以及該第一聲音信號當前的第一預設噪音能量更新該第一聲音信號的第一預設噪音能量。
在一種可能的實現(xiàn)方式中,若該第二語音能量小于或等于該第一閾值,則確定該第一聲音信號和該第二聲音信號中不具有語音;基于平滑因子、該第一總能量以及當前的該第一預設噪音能量更新該第一預設噪音能量;基于該平滑因子、該第二總能量以及當前的該第二預設噪音能量更新該第二預設噪音能量。
在一種可能的實現(xiàn)方式中,ENA(m+1)=αENA(m)+(1-α)EA(m),該ENA(m+1)為更新后的該第一聲音信號的第一預設噪音能量,該m為當前幀的幀標識,該m+1為下一幀的幀標識,該ENA(m)為該第一聲音信號當前的第一預設噪音能量,該EA(m)指該第一總能量,該α為該平滑因子。
在一種可能的實現(xiàn)方式中,若連續(xù)確定該第一聲音信號和該第二聲音信號中不具有語音的次數(shù)超過預設次數(shù),則等待預設時間后再獲取該第一聲音信號和該第二聲音信號。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于紫光展銳(重慶)科技有限公司,未經(jīng)紫光展銳(重慶)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110500083.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





