[發明專利]音頻處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010737225.0 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN111899726A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 李杰;成凱;郭少軍 | 申請(專利權)人: | 上海喜日電子科技有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L25/78;G10L25/84 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張磊 |
| 地址: | 201100 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 電子設備 存儲 介質 | ||
1.一種音頻處理方法,其特征在于,所述方法包括:
獲取語音控制時的音頻數據;
從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段,其中,在所述靜默時長內,該音頻數據對應的聲音強度不超過靜默閾值;
將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定超過該第二時長閾值的有效音頻片段。
2.根據權利要求1所述的頻處理方法,其特征在于,所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定出超過該第二時長閾值的有效音頻片段的步驟,包括:
將所述待識別音頻片段的采集時長與所述第二時長閾值進行比較;
若所述待識別音頻片段的采集時長超過該第二時長閾值,則將所述待識別音頻片段確定為所述有效音頻片段:
若所述待識別音頻片段的采集時長不超過該第二時長閾值,則獲取新的音頻數據,再次從所述音頻數據中確定出靜默時長不超過第一時長閾值的待識別音頻片段的步驟執行。
3.根據權利要求1所述的音頻處理方法,其特征在于,所述從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段的步驟,包括:
從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的至少一條待識別音頻片段;
所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定超過該第二時長閾值的有效音頻片段的步驟,包括:
針對每條待識別音頻片段,將所述待識別音頻片段的錄音時長與所述第一時長閾值進行比較。
4.根據權利要求1所述的音頻處理方法,其特征在于,所述方法還包括:
統計多條有效語音片段的錄音時長;
根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值,獲得新的第二時長閾值。
5.根據權利要求4所述的音頻處理方法,其特征在于,所述根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值的步驟,包括:
根據所述多條有效語音的錄音時長,獲取所述多條有效語音的錄音時長的高斯分布;
根據所述高斯分布的結果,確定出置信區間超過置信閾值的時長作為所述新的第二時長閾值。
6.根據權利要求4所述的音頻處理方法,其特征在于,所述根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值的步驟,包括:
將所述多條有效語音片段的錄音時長按照遞增或遞減的順序進行排序,獲得排序結果;
根據所述排序結果,選取所述排序結果中預設位置的錄音時長作為所述新的第二時長閾值。
7.根據權利要求1所述的音頻處理方法,其特征在于,記錄有聲紋信息與待匹配第二時長閾值的對應關系,所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較之前,還包括:
獲取所述待識別音頻片段的聲紋信息;
根據所述待識別音頻片段的聲紋信息從所述待匹配第二時長閾值中確定出所述第二時長閾值。
8.一種音頻處理裝置,其特征在于,所述音頻處理裝置包括:
音頻獲取模塊,用于獲取語音控制時的音頻數據;
片段確定模塊,用于從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段,其中,在所述靜默時長內,該音頻數據對應的聲音強度不超過靜默閾值;
片段識別模塊,用于將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定超過該第二時長閾值的有效音頻片段。
9.根據權利要求8所述的音頻處理裝置,其特征在于,所述音頻處理裝置還包括:
時長統計模塊,用于統計多條有效語音片段的錄音時長;
時長調整模塊,用于根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海喜日電子科技有限公司,未經上海喜日電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010737225.0/1.html,轉載請聲明來源鉆瓜專利網。





