[發(fā)明專(zhuān)利]語(yǔ)音活動(dòng)檢測(cè)方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201710578644.2 | 申請(qǐng)日: | 2017-07-14 |
| 公開(kāi)(公告)號(hào): | CN107393558B | 公開(kāi)(公告)日: | 2020-09-11 |
| 發(fā)明(設(shè)計(jì))人: | 蔡鋼林 | 申請(qǐng)(專(zhuān)利權(quán))人: | 深圳永順智信息科技有限公司 |
| 主分類(lèi)號(hào): | G10L25/78 | 分類(lèi)號(hào): | G10L25/78 |
| 代理公司: | 深圳市明日今典知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44343 | 代理人: | 王杰輝 |
| 地址: | 518000 廣東省深圳市*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 活動(dòng) 檢測(cè) 方法 裝置 | ||
本發(fā)明提出的一種語(yǔ)音活動(dòng)檢測(cè)方法及裝置,其方法包括,計(jì)算聲音信號(hào)的聽(tīng)覺(jué)特征,所述聽(tīng)覺(jué)特征包括與先驗(yàn)信噪比相關(guān)的第一維度參數(shù)、與后驗(yàn)信噪比相關(guān)的第二維度參數(shù)、與時(shí)域信號(hào)相關(guān)的第三維度參數(shù);將所述第一維度參數(shù)、第二維度參數(shù)、第三維度參數(shù)與各自對(duì)應(yīng)的聽(tīng)覺(jué)閾值比較,獲得檢測(cè)結(jié)果。本發(fā)明采用先驗(yàn)信噪比、后驗(yàn)信噪比聯(lián)合時(shí)域信號(hào)表征聽(tīng)覺(jué)特征,提取的聽(tīng)覺(jué)特征與聽(tīng)覺(jué)閾值比較,檢測(cè)實(shí)時(shí)的語(yǔ)音活動(dòng)。本發(fā)明可在單麥克風(fēng)體系下,有效地提取在遠(yuǎn)講情況下的聽(tīng)覺(jué)特征,檢測(cè)聲音信號(hào)中語(yǔ)音的存在。
技術(shù)領(lǐng)域
本發(fā)明涉及到語(yǔ)音識(shí)別領(lǐng)域,特別是涉及到一種語(yǔ)音活動(dòng)檢測(cè)方法及裝置。
背景技術(shù)
近年來(lái)隨著互聯(lián)網(wǎng)技術(shù)、智能硬件的蓬勃發(fā)展,語(yǔ)音識(shí)別、聲紋識(shí)別、聲源檢測(cè)等語(yǔ)音智能交互技術(shù)開(kāi)始從實(shí)驗(yàn)室走向用戶(hù)。由于語(yǔ)音識(shí)別技術(shù)是基于語(yǔ)音的人機(jī)交互系統(tǒng)最核心的技術(shù)。目前在限定條件下識(shí)別率已經(jīng)達(dá)到可用的準(zhǔn)確率。所謂限定調(diào)節(jié)通常是指用戶(hù)距離麥克風(fēng)較近,噪聲干擾較小。而必須近距離發(fā)出語(yǔ)音指令這一條件限制了語(yǔ)音交互的便捷性。
在遠(yuǎn)講情況下,由于語(yǔ)音能量會(huì)快速衰減,而噪音干擾能量大致不變,會(huì)使得識(shí)別率迅速下降。另外一個(gè)影響識(shí)別準(zhǔn)確率的因素是,語(yǔ)音指令到達(dá)房間墻壁多次反射之后的混響,也會(huì)造成實(shí)際應(yīng)用與語(yǔ)音識(shí)別訓(xùn)練數(shù)據(jù)集的不匹配,影響識(shí)別率。
噪音主要有兩個(gè)來(lái)源:(1)麥克風(fēng)信號(hào)采集系統(tǒng)自帶的信道噪聲,信道噪聲因麥克風(fēng)的敏感性而不同,麥克風(fēng)敏感性越高,通常信道噪聲越高;(2)不可忽略的環(huán)境噪聲干擾,比如電視機(jī)、空調(diào)噪聲等等。相比于噪聲,混響由于產(chǎn)生條件更為復(fù)雜,更難抑制。并且,噪音和混響一般同時(shí)存在,使得混響抑制更加困難。
201510119374.X公開(kāi)了一種語(yǔ)音檢測(cè)方法及裝置,方法具體包括:將所采集的聲音信號(hào)進(jìn)行重疊分幀,得到對(duì)應(yīng)的多個(gè)聲音幀;對(duì)所得到的多個(gè)聲音幀進(jìn)行加窗處理;將經(jīng)過(guò)加窗處理后的聲音幀進(jìn)行頻域轉(zhuǎn)換,得到各個(gè)聲音幀對(duì)應(yīng)的頻譜;將所得到的各個(gè)聲音幀對(duì)應(yīng)的頻譜進(jìn)行倒頻譜域轉(zhuǎn)換,得到對(duì)應(yīng)的倒頻譜;計(jì)算相鄰的兩個(gè)聲音幀的倒頻譜之間的倒譜距離;當(dāng)計(jì)算得出的倒譜距離大于預(yù)設(shè)的距離閾值時(shí),對(duì)所采集的聲音信號(hào)進(jìn)行語(yǔ)音檢測(cè)。該方案可以節(jié)省語(yǔ)音檢測(cè)的時(shí)間。
然而,該方法采用的是計(jì)算出的倒譜距離與預(yù)設(shè)閾值比較,雖然預(yù)設(shè)了不同距離下的閾值,但由于實(shí)際環(huán)境的復(fù)雜性,導(dǎo)致預(yù)設(shè)閾值往往無(wú)法在具體場(chǎng)景中應(yīng)用,進(jìn)而導(dǎo)致語(yǔ)音識(shí)別正確率下降。
現(xiàn)有的還有一種超定向Beamforming技術(shù),其采用環(huán)形或者線形麥克風(fēng)陣列,通過(guò)一組空域?yàn)V波器,定向增強(qiáng)目標(biāo)聲源方向信號(hào)。超定向Beamforming技術(shù)是從采樣方面提高聲音信號(hào)的質(zhì)量。但是,采用超定向Beamforming技術(shù),需要麥克風(fēng)的數(shù)量比較多,并且對(duì)麥克風(fēng)的一致性、麥克風(fēng)的幾何位置的精確度要求很高,增加了硬件上實(shí)現(xiàn)的難度和成本,很難在大多數(shù)中、低層次產(chǎn)品中集成,應(yīng)用范圍非常局限。
發(fā)明內(nèi)容
本發(fā)明的主要目的為提供一種語(yǔ)音活動(dòng)檢測(cè)方法及裝置,可在單麥克風(fēng)體系下,有效地提取在遠(yuǎn)講情況下的聽(tīng)覺(jué)特征,檢測(cè)聲音信號(hào)中語(yǔ)音的存在。
本發(fā)明提出一種語(yǔ)音活動(dòng)檢測(cè)方法,包括以下步驟:
計(jì)算聲音信號(hào)的聽(tīng)覺(jué)特征,所述聽(tīng)覺(jué)特征包括與先驗(yàn)信噪比相關(guān)的第一維度參數(shù)、與后驗(yàn)信噪比相關(guān)的第二維度參數(shù)、與時(shí)域信號(hào)相關(guān)的第三維度參數(shù);
將所述第一維度參數(shù)、第二維度參數(shù)、第三維度參數(shù)與各自對(duì)應(yīng)的聽(tīng)覺(jué)閾值比較,獲得檢測(cè)結(jié)果。若所述第一維度參數(shù)、第二維度參數(shù)、第三維度參數(shù)中任意一個(gè)大于各自對(duì)應(yīng)的聽(tīng)覺(jué)閾值,則判定所述聲音信號(hào)存在語(yǔ)音活動(dòng)。若所述第一維度參數(shù)、第二維度參數(shù)、第三維度參數(shù)中任意一個(gè)大于各自對(duì)應(yīng)的聽(tīng)覺(jué)閾值,則判定所述聲音信號(hào)沒(méi)有語(yǔ)音活動(dòng)。
優(yōu)選地,所述第一維度參數(shù)以V(1)表示,其由以下公式求得:
其中,γ(k)為先驗(yàn)信噪比,k為頻率,K為頻帶整體的數(shù)量;
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于深圳永順智信息科技有限公司,未經(jīng)深圳永順智信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710578644.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 用于活動(dòng)廣告、活動(dòng)墻壁及活動(dòng)棚頂安裝的活動(dòng)棚壁架
- 帶活動(dòng)橡皮的活動(dòng)鉛筆
- 活動(dòng)盒體、活動(dòng)盒蓋和活動(dòng)盒
- 活動(dòng)庫(kù)房活動(dòng)式吊環(huán)
- 活動(dòng)記錄裝置、活動(dòng)記錄程序以及活動(dòng)記錄方法
- 活動(dòng)記錄裝置、活動(dòng)記錄方法以及記錄介質(zhì)
- 活動(dòng)彎頭活動(dòng)節(jié)連接結(jié)構(gòu)
- 活動(dòng)影壁(江華高檔活動(dòng)影壁)
- 活動(dòng)柜(鉆石活動(dòng)柜)
- 帶活動(dòng)擦皮的活動(dòng)鉛筆
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





