[發明專利]音頻處理方法、裝置、電子設備及存儲介質在審

申請號：	202010737225.0	申請日：	2020-07-28
公開（公告）號：	CN111899726A	公開（公告）日：	2020-11-06
發明（設計）人：	李杰;成凱;郭少軍	申請（專利權）人：	上海喜日電子科技有限公司
主分類號：	G10L15/04	分類號：	G10L15/04;G10L25/78;G10L25/84
代理公司：	北京超凡宏宇專利代理事務所(特殊普通合伙) 11463	代理人：	張磊
地址：	201100 上海市***	國省代碼：	上海;31
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	音頻處理方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【權利要求書】：

1.一種音頻處理方法，其特征在于，所述方法包括：

獲取語音控制時的音頻數據；

從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段，其中，在所述靜默時長內，該音頻數據對應的聲音強度不超過靜默閾值；

將所述待識別音頻片段的采集時長與第二時長閾值進行比較，確定超過該第二時長閾值的有效音頻片段。

2.根據權利要求1所述的頻處理方法，其特征在于，所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較，確定出超過該第二時長閾值的有效音頻片段的步驟，包括：

將所述待識別音頻片段的采集時長與所述第二時長閾值進行比較；

若所述待識別音頻片段的采集時長超過該第二時長閾值，則將所述待識別音頻片段確定為所述有效音頻片段：

若所述待識別音頻片段的采集時長不超過該第二時長閾值，則獲取新的音頻數據，再次從所述音頻數據中確定出靜默時長不超過第一時長閾值的待識別音頻片段的步驟執行。

3.根據權利要求1所述的音頻處理方法，其特征在于，所述從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段的步驟，包括：

從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的至少一條待識別音頻片段；

所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較，確定超過該第二時長閾值的有效音頻片段的步驟，包括：

針對每條待識別音頻片段，將所述待識別音頻片段的錄音時長與所述第一時長閾值進行比較。

4.根據權利要求1所述的音頻處理方法，其特征在于，所述方法還包括：

統計多條有效語音片段的錄音時長；

根據所述多條有效語音片段的錄音時長的統計結果，調整所述第二時長閾值，獲得新的第二時長閾值。

5.根據權利要求4所述的音頻處理方法，其特征在于，所述根據所述多條有效語音片段的錄音時長的統計結果，調整所述第二時長閾值的步驟，包括：

根據所述多條有效語音的錄音時長，獲取所述多條有效語音的錄音時長的高斯分布；

根據所述高斯分布的結果，確定出置信區間超過置信閾值的時長作為所述新的第二時長閾值。

6.根據權利要求4所述的音頻處理方法，其特征在于，所述根據所述多條有效語音片段的錄音時長的統計結果，調整所述第二時長閾值的步驟，包括：

將所述多條有效語音片段的錄音時長按照遞增或遞減的順序進行排序，獲得排序結果；

根據所述排序結果，選取所述排序結果中預設位置的錄音時長作為所述新的第二時長閾值。

7.根據權利要求1所述的音頻處理方法，其特征在于，記錄有聲紋信息與待匹配第二時長閾值的對應關系，所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較之前，還包括：

獲取所述待識別音頻片段的聲紋信息；

根據所述待識別音頻片段的聲紋信息從所述待匹配第二時長閾值中確定出所述第二時長閾值。

8.一種音頻處理裝置，其特征在于，所述音頻處理裝置包括：

音頻獲取模塊，用于獲取語音控制時的音頻數據；

片段確定模塊，用于從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段，其中，在所述靜默時長內，該音頻數據對應的聲音強度不超過靜默閾值；

片段識別模塊，用于將所述待識別音頻片段的采集時長與第二時長閾值進行比較，確定超過該第二時長閾值的有效音頻片段。

9.根據權利要求8所述的音頻處理裝置，其特征在于，所述音頻處理裝置還包括：

時長統計模塊，用于統計多條有效語音片段的錄音時長；

時長調整模塊，用于根據所述多條有效語音片段的錄音時長的統計結果，調整所述第二時長閾值。

下載完整專利技術內容需要扣除積分，VIP會員可以免費下載。

免登錄下載普通用戶下載升級VIP會員，免費下載

該專利技術資料僅供研究查看技術是否侵權等信息，商用須獲得專利權人授權。該專利全部權利屬于上海喜日電子科技有限公司，未經上海喜日電子科技有限公司許可，擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作，請聯系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202010737225.0/1.html，轉載請聲明來源鉆瓜專利網。

上一篇：一種用于驅動窗簾的渦卷彈簧及其成型方法
下一篇：一種黑名單多方交叉驗證和共享的方法及系統

同類專利

專利分類

G 物理

G10 樂器；聲學
G10L 語音分析或合成；語音識別；音頻分析或處理
G10L15-00 語音識別
G10L15-02 .語音識別的特征提取；識別單位的選擇
G10L15-04 .分段或字極限檢測
G10L15-06 .創建基準模板；訓練語音識別系統，例如對說話者聲音特征的適應
G10L15-08 .語音分類或檢索
G10L15-20 .專門適用于不利環境

免登錄下載普通用戶下載升級VIP會員，免費下載

專利文獻下載

說明：

1、專利原文基于中國國家知識產權局專利說明書；

2、支持發明專利、實用新型專利、外觀設計專利（升級中）；

3、專利數據每周兩次同步更新，支持Adobe PDF格式；

4、內容包括專利技術的結構示意圖、流程工藝圖或技術構造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進行下載，點擊【登陸】【注冊】