[發(fā)明專利]在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法和裝置有效
| 申請(qǐng)?zhí)枺?/td> | 202110592214.2 | 申請(qǐng)日: | 2021-05-28 |
| 公開(公告)號(hào): | CN113160855B | 公開(公告)日: | 2022-10-21 |
| 發(fā)明(設(shè)計(jì))人: | 俞凱;徐薛楠;丁翰林;吳夢(mèng)玥 | 申請(qǐng)(專利權(quán))人: | 思必馳科技股份有限公司 |
| 主分類號(hào): | G10L25/87 | 分類號(hào): | G10L25/87 |
| 代理公司: | 北京商專永信知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11400 | 代理人: | 黃謙;鄧婷婷 |
| 地址: | 215123 江蘇省蘇州市蘇*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 在線 語音 活性 檢測(cè) 系統(tǒng) 改進(jìn) 方法 裝置 | ||
本發(fā)明公開在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法和裝置,其中,一種在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法,包括:將真實(shí)世界可用的語音活性檢測(cè)系統(tǒng)作為教師模型;利用所述教師模型輸出待測(cè)語音的幀級(jí)別的語音概率,其中,所述待測(cè)語音包括真實(shí)世界的語音數(shù)據(jù);將所述幀級(jí)別的語音概率作為訓(xùn)練標(biāo)簽訓(xùn)練學(xué)生模型,其中,所述學(xué)生模型的雙向門控循環(huán)單元改為單向門控循環(huán)單元;用所述學(xué)生模型給出的概率預(yù)測(cè)語音和非語音。
技術(shù)領(lǐng)域
本發(fā)明屬于模型訓(xùn)練技術(shù)領(lǐng)域,尤其涉及在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法和裝置。
背景技術(shù)
相關(guān)技術(shù)中,一般的語音活性檢測(cè)系統(tǒng)旨在檢測(cè)出一段音頻中有語音的部分,通過將一段語音分幀,送入模型中,由模型學(xué)習(xí)出語音的特征,判斷某一幀是否為語音幀。真實(shí)世界中可用的語音活性檢測(cè)系統(tǒng)采用類似的技術(shù),但是在真實(shí)數(shù)據(jù)中表現(xiàn)得更好。
發(fā)明人在實(shí)現(xiàn)本申請(qǐng)的過程中發(fā)現(xiàn)現(xiàn)有技術(shù)的方案存在以下缺陷:一般的語音活性檢測(cè)系統(tǒng)在噪聲環(huán)境下表現(xiàn)不夠魯棒,真實(shí)世界可用的語音活性檢測(cè)系統(tǒng)在干凈的語音環(huán)境或者合成噪聲環(huán)境下的表現(xiàn)不夠好,而且無法做到在線使用。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法和裝置,用于至少解決上述技術(shù)問題之一。
第一方面,本發(fā)明實(shí)施例提供一種在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法,包括:將真實(shí)世界可用的語音活性檢測(cè)系統(tǒng)作為教師模型;利用所述教師模型輸出待測(cè)語音的幀級(jí)別的語音概率,其中,所述待測(cè)語音包括真實(shí)世界的語音數(shù)據(jù);將所述幀級(jí)別的語音概率作為訓(xùn)練標(biāo)簽訓(xùn)練學(xué)生模型,其中,所述學(xué)生模型的雙向門控循環(huán)單元改為單向門控循環(huán)單元;用所述學(xué)生模型給出的概率預(yù)測(cè)語音和非語音。
第二方面,本發(fā)明實(shí)施例提供一種在線語音活性檢測(cè)系統(tǒng)改進(jìn)裝置,包括:教師模型程序模塊,配置為將真實(shí)世界可用的語音活性檢測(cè)系統(tǒng)作為教師模型;輸出程序模塊,配置為利用所述教師模型輸出待測(cè)語音的幀級(jí)別的語音概率,其中,所述待測(cè)語音包括真實(shí)世界的語音數(shù)據(jù);訓(xùn)練程序模塊,配置為將所述幀級(jí)別的語音概率作為訓(xùn)練標(biāo)簽訓(xùn)練學(xué)生模型,其中,所述學(xué)生模型的雙向門控循環(huán)單元改為單向門控循環(huán)單元;以及預(yù)測(cè)程序模塊,配置為用所述學(xué)生模型給出的概率預(yù)測(cè)語音和非語音。
第三方面,提供一種電子設(shè)備,其包括:至少一個(gè)處理器,以及與所述至少一個(gè)處理器通信連接的存儲(chǔ)器,其中,所述存儲(chǔ)器存儲(chǔ)有可被所述至少一個(gè)處理器執(zhí)行的指令,所述指令被所述至少一個(gè)處理器執(zhí)行,以使所述至少一個(gè)處理器能夠執(zhí)行本發(fā)明任一實(shí)施例的在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法的步驟。
第四方面,本發(fā)明實(shí)施例還提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括存儲(chǔ)在非易失性計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)上的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序包括程序指令,當(dāng)所述程序指令被計(jì)算機(jī)執(zhí)行時(shí),使所述計(jì)算機(jī)執(zhí)行本發(fā)明任一實(shí)施例的在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法的步驟。
本申請(qǐng)的方法和裝置通過將真實(shí)世界可用的語音活性檢測(cè)系統(tǒng)作為教師模型,通過其輸出的幀級(jí)別的語音概率,作為訓(xùn)練標(biāo)簽訓(xùn)練學(xué)生模型,同時(shí)將學(xué)生模型變成更小的模型,并將其中的雙向門控循環(huán)單元改為單向門控循環(huán)單元,得到性能更好的、更輕量級(jí)的線上可用的語音活性檢測(cè)系統(tǒng)。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作一簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實(shí)施例提供的一種在線語音活性檢測(cè)系統(tǒng)改進(jìn)方法的流程圖;
圖2為本發(fā)明一實(shí)施例提供的教師學(xué)生模型;
圖3為本發(fā)明一實(shí)施例提供的兩個(gè)段隨機(jī)的逐幀語音概率從Aurora 4采樣;
圖4為本發(fā)明一實(shí)施例提供的一種在線語音活性檢測(cè)系統(tǒng)改進(jìn)裝置的框圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思必馳科技股份有限公司,未經(jīng)思必馳科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110592214.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 用于呈現(xiàn)在線實(shí)體在線狀態(tài)的系統(tǒng)和方法
- 提供web服務(wù)接入的在線系統(tǒng)和方法
- 定制在線圖標(biāo)
- 一種水質(zhì)在線檢測(cè)預(yù)處理裝置
- 在線測(cè)試學(xué)習(xí)方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 一種在線文檔的分頁(yè)方法、裝置、設(shè)備以及可讀介質(zhì)
- 一種基于web在線學(xué)習(xí)的資源訪問平臺(tái)
- 一種在線學(xué)習(xí)系統(tǒng)
- 在線文檔提交方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 空調(diào)冷媒量確定方法、系統(tǒng)和可讀存儲(chǔ)介質(zhì)
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)





