[發明專利]語音數據處理方法、裝置、電子設備和存儲介質在審
| 申請號: | 202210450693.9 | 申請日: | 2022-04-26 |
| 公開(公告)號: | CN114792530A | 公開(公告)日: | 2022-07-26 |
| 發明(設計)人: | 趙東宇;夏立超;劉寧;張法朝;奉飛飛;唐劍 | 申請(專利權)人: | 美的集團(上海)有限公司;美的集團股份有限公司 |
| 主分類號: | G10L25/87 | 分類號: | G10L25/87;G10L15/04;G10L15/22 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 周淑娟 |
| 地址: | 201700 上海市青浦區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 數據處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種語音數據處理方法,其特征在于,包括:
基于原始語音段的當前時刻的語音有效性檢測結果確定與所述當前時刻對應的語音數據幀為無效幀,獲取所述原始語音段的第一歷史時刻的語音有效性檢測結果和所述原始語音段的第二歷史時刻的語音有效性檢測結果;
基于所述第一歷史時刻的語音有效性檢測結果確定與所述第一歷史時刻對應的語音數據幀為無效幀,且基于所述第二歷史時刻的語音有效性檢測結果確定與所述第二歷史時刻對應的語音數據幀為有效幀,將與所述第一歷史時刻對應的語音數據幀確定為目標語音片段的截斷端點;
其中,所述第一歷史時刻為所述當前時刻之前的某一時刻,所述第二歷史時刻為所述第一歷史時刻的前一時刻;所述目標語音片段為所述原始語音段中的其中一語音段。
2.根據權利要求1所述的語音數據處理方法,其特征在于,所述第一歷史時刻與所述當前時刻之間相隔有至少一時刻。
3.根據權利要求2所述的語音數據處理方法,其特征在于,所述基于所述第一歷史時刻的語音有效性檢測結果確定與所述第一歷史時刻對應的語音數據幀為無效幀,且基于所述第二歷史時刻的語音有效性檢測結果確定與所述第二歷史時刻對應的語音數據幀為有效幀,將與所述第一歷史時刻對應的語音數據幀確定為目標語音片段的截斷端點,包括:
基于所述第一歷史時刻的語音有效性檢測結果確定與所述第一歷史時刻對應的語音數據幀為無效幀,且基于所述第二歷史時刻的語音有效性檢測結果確定與所述第二歷史時刻對應的語音數據幀為有效幀,獲取所述第一歷史時刻與所述當前時刻之間的至少一時刻對應的至少一語音有效性檢測結果;
基于所述至少一語音有效性檢測結果確定與所述至少一時刻對應的所有語音數據幀均為無效幀,將與所述第一歷史時刻對應的語音數據幀確定為目標語音片段的截斷端點。
4.根據權利要求1所述的語音數據處理方法,其特征在于,在所述基于原始語音段的當前時刻的語音有效性檢測結果確定與所述當前時刻對應的語音數據幀為無效幀,獲取所述原始語音段的第一歷史時刻的語音有效性檢測結果和所述原始語音段的第二歷史時刻的語音有效性檢測結果之前,還包括:
基于目標時刻的語音有效性檢測結果確定與所述目標時刻對應的語音數據幀為有效幀,并獲取所述原始語音段的第三歷史時刻的語音有效性檢測結果;
基于所述第三歷史時刻的語音有效性檢測結果確定與所述第三歷史時刻對應的語音數據幀為無效幀,將與所述目標時刻對應的語音數據幀確定為所述目標語音片段的起始端點;
其中,所述第三歷史時刻為所述目標時刻的前一時刻。
5.根據權利要求4所述的語音數據處理方法,其特征在于,在所述基于所述第一歷史時刻的語音有效性檢測結果確定與所述第一歷史時刻對應的語音數據幀為無效幀,且基于所述第二歷史時刻的語音有效性檢測結果確定與所述第二歷史時刻對應的語音數據幀為有效幀,將與所述第一歷史時刻對應的語音數據幀確定為目標語音片段的截斷端點之后,還包括:
基于所述起始端點和所述截斷端點從所述原始語音段中截取得到所述目標語音片段。
6.根據權利要求1所述的語音數據處理方法,其特征在于,所述第一歷史時刻與所述當前時刻之間相隔的時刻數量為基于所述原始語音段的長度進行確定得到;或者,
所述第一歷史時刻與所述當前時刻之間相隔的時刻數量為基于系統當前場景模式進行確定得到。
7.根據權利要求1-6任一項所述的語音數據處理方法,其特征在于,在所述基于原始語音段的當前時刻的語音有效性檢測結果確定與所述當前時刻對應的語音數據幀為無效幀,獲取所述原始語音段的第一歷史時刻的語音有效性檢測結果和所述原始語音段的第二歷史時刻的語音有效性檢測結果之前,還包括:
確定所述原始語音段中每一語音數據幀的音頻強度值和過零率;
確定所述語音數據幀的音頻強度值大于預設強度閾值,且所述語音數據幀的過零率小于預設過零率閾值,將所述語音數據幀的語音有效性檢測結果確定為有效幀標記;
確定所述語音數據幀的音頻強度值不大于預設強度閾值,或所述語音數據幀的過零率不小于預設過零率閾值,將所述語音數據幀的語音有效性檢測結果確定為無效幀標記。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于美的集團(上海)有限公司;美的集團股份有限公司,未經美的集團(上海)有限公司;美的集團股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210450693.9/1.html,轉載請聲明來源鉆瓜專利網。





