[發(fā)明專(zhuān)利]語(yǔ)音數(shù)據(jù)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202210450693.9 | 申請(qǐng)日: | 2022-04-26 |
| 公開(kāi)(公告)號(hào): | CN114792530A | 公開(kāi)(公告)日: | 2022-07-26 |
| 發(fā)明(設(shè)計(jì))人: | 趙東宇;夏立超;劉寧;張法朝;奉飛飛;唐劍 | 申請(qǐng)(專(zhuān)利權(quán))人: | 美的集團(tuán)(上海)有限公司;美的集團(tuán)股份有限公司 |
| 主分類(lèi)號(hào): | G10L25/87 | 分類(lèi)號(hào): | G10L25/87;G10L15/04;G10L15/22 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 周淑娟 |
| 地址: | 201700 上海市青浦區(qū)*** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 語(yǔ)音 數(shù)據(jù)處理 方法 裝置 電子設(shè)備 存儲(chǔ) 介質(zhì) | ||
本申請(qǐng)涉及語(yǔ)音數(shù)據(jù)處理技術(shù)領(lǐng)域,提供一種語(yǔ)音數(shù)據(jù)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì),該方法包括:基于當(dāng)前時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果確定與當(dāng)前時(shí)刻對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀為無(wú)效幀,獲取第一歷史時(shí)刻和第二歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果;基于第一歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果確定對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀為無(wú)效幀,且基于第二歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果確定對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀為有效幀,將與第一歷史時(shí)刻對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀確定為目標(biāo)語(yǔ)音片段的截?cái)喽它c(diǎn)。本申請(qǐng)通過(guò)在有效語(yǔ)音段截取的過(guò)程中加入后處理邏輯,對(duì)截取有效語(yǔ)音段的結(jié)束條件加以約束,從而防止完整語(yǔ)音段由于中途存在短時(shí)靜音而被誤分割為多段,提高有效語(yǔ)音片段截取的魯棒性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及語(yǔ)音數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及語(yǔ)音數(shù)據(jù)處理方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)。
背景技術(shù)
語(yǔ)音喚醒技術(shù)通過(guò)在設(shè)備或軟件中預(yù)置喚醒詞,當(dāng)用戶(hù)發(fā)出該語(yǔ)音指令時(shí),設(shè)備便從休眠狀態(tài)中被喚醒,并作出指定響應(yīng),大大提升了人機(jī)交互的效率。為了保護(hù)用戶(hù)隱私,在設(shè)備喚醒之前不能將語(yǔ)音數(shù)據(jù)上傳,因此,語(yǔ)音喚醒往往要在本地設(shè)備實(shí)現(xiàn)。
受到成本的限制,本地設(shè)備往往存在算力不足、內(nèi)存空間小的局限。為了實(shí)現(xiàn)低功耗的離線(xiàn)語(yǔ)音喚醒,不能將所有語(yǔ)音信號(hào)都直接進(jìn)行喚醒詞判斷算法步驟,而是對(duì)語(yǔ)音信號(hào)分析后,將有效的語(yǔ)音段提取出來(lái)進(jìn)行喚醒詞的判斷。
通過(guò)有效語(yǔ)音片段檢測(cè)進(jìn)行截取,單獨(dú)對(duì)語(yǔ)音片段進(jìn)行分析判斷,不僅大大降低了數(shù)據(jù)量與計(jì)算量,還有助于提高喚醒率、降低誤喚醒率。采用VAD(Voice ActivityDetection,語(yǔ)音活動(dòng)檢測(cè))技術(shù)對(duì)輸入語(yǔ)音信號(hào)進(jìn)行有效語(yǔ)音片段的開(kāi)始點(diǎn)和結(jié)束點(diǎn)的檢測(cè),可以將有效的語(yǔ)音段截取出來(lái),針對(duì)性地對(duì)語(yǔ)音信號(hào)進(jìn)行分析處理。
但是,采用現(xiàn)有技術(shù)進(jìn)行有效語(yǔ)音片段的檢測(cè),在某些情況下(尤其安靜環(huán)境下)容易過(guò)早地判斷一段語(yǔ)音的結(jié)束點(diǎn),導(dǎo)致將一個(gè)完整的有效語(yǔ)音段誤分割為若干段,影響后續(xù)獲取喚醒詞判斷結(jié)果的準(zhǔn)確性。
發(fā)明內(nèi)容
本申請(qǐng)旨在至少解決相關(guān)技術(shù)中存在的技術(shù)問(wèn)題之一。為此,本申請(qǐng)?zhí)岢鲆环N語(yǔ)音數(shù)據(jù)處理方法,能夠提高語(yǔ)音片段截取的魯棒性。
本申請(qǐng)還提出一種語(yǔ)音數(shù)據(jù)處理裝置。
本申請(qǐng)還提出一種電子設(shè)備。
本申請(qǐng)還提出一種存儲(chǔ)介質(zhì)。
本申請(qǐng)還提出一種計(jì)算機(jī)程序產(chǎn)品。
根據(jù)本申請(qǐng)第一方面實(shí)施例的語(yǔ)音數(shù)據(jù)處理方法,包括:
基于原始語(yǔ)音段的當(dāng)前時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果確定與所述當(dāng)前時(shí)刻對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀為無(wú)效幀,獲取所述原始語(yǔ)音段的第一歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果和所述原始語(yǔ)音段的第二歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果;
基于所述第一歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果確定與所述第一歷史時(shí)刻對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀為無(wú)效幀,且基于所述第二歷史時(shí)刻的語(yǔ)音有效性檢測(cè)結(jié)果確定與所述第二歷史時(shí)刻對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀為有效幀,將與所述第一歷史時(shí)刻對(duì)應(yīng)的語(yǔ)音數(shù)據(jù)幀確定為目標(biāo)語(yǔ)音片段的截?cái)喽它c(diǎn);
其中,所述第一歷史時(shí)刻為所述當(dāng)前時(shí)刻之前的某一時(shí)刻,所述第二歷史時(shí)刻為所述第一歷史時(shí)刻的前一時(shí)刻;所述目標(biāo)語(yǔ)音片段為所述原始語(yǔ)音段中的其中一語(yǔ)音段。
根據(jù)本申請(qǐng)實(shí)施例的語(yǔ)音數(shù)據(jù)處理方法,通過(guò)在有效語(yǔ)音段截取的過(guò)程中加入后處理邏輯,對(duì)截取有效語(yǔ)音段的結(jié)束條件加以約束,從而防止完整語(yǔ)音段由于中途存在短時(shí)靜音而被誤分割為多段,提高有效語(yǔ)音片段截取的魯棒性。
根據(jù)本申請(qǐng)的一個(gè)實(shí)施例,所述第一歷史時(shí)刻與所述當(dāng)前時(shí)刻之間相隔有至少一時(shí)刻。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于美的集團(tuán)(上海)有限公司;美的集團(tuán)股份有限公司,未經(jīng)美的集團(tuán)(上海)有限公司;美的集團(tuán)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210450693.9/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 用于語(yǔ)音處理的方法與系統(tǒng)
- 一種語(yǔ)音識(shí)別測(cè)試系統(tǒng)及方法
- 用于語(yǔ)音識(shí)別的方法和裝置
- 一種語(yǔ)音消毒柜的控制方法及語(yǔ)音消毒柜
- 一種語(yǔ)音處理方法及裝置
- 混合語(yǔ)音識(shí)別方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 語(yǔ)音情緒識(shí)別方法、系統(tǒng)、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 一種具有語(yǔ)音識(shí)別功能的智能語(yǔ)音終端設(shè)備
- 語(yǔ)音增強(qiáng)方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 一種聲紋鑒定語(yǔ)音重組方法和系統(tǒng)
- 數(shù)據(jù)處理設(shè)備,數(shù)據(jù)處理方法,和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理電路、數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法、數(shù)據(jù)處理控制方法
- 數(shù)據(jù)處理設(shè)備、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法及計(jì)算機(jī)可讀取的記錄介質(zhì)
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法以及數(shù)據(jù)處理程序
- 數(shù)據(jù)處理裝置、數(shù)據(jù)處理方法和數(shù)據(jù)處理程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線(xiàn)程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 光源裝置、照明裝置、液晶裝置和電子裝置
- 預(yù)測(cè)裝置、編輯裝置、逆預(yù)測(cè)裝置、解碼裝置及運(yùn)算裝置
- 圖像形成裝置、定影裝置、遮光裝置以及保持裝置
- 打印裝置、讀取裝置、復(fù)合裝置以及打印裝置、讀取裝置、復(fù)合裝置的控制方法
- 電子裝置、光盤(pán)裝置、顯示裝置和攝像裝置
- 光源裝置、照明裝置、曝光裝置和裝置制造方法
- 用戶(hù)裝置、裝置對(duì)裝置用戶(hù)裝置、后端裝置及其定位方法
- 遙控裝置、通信裝置、可變裝置及照明裝置
- 透鏡裝置、攝像裝置、處理裝置和相機(jī)裝置
- 抖動(dòng)校正裝置、驅(qū)動(dòng)裝置、成像裝置、和電子裝置





