[發明專利]音頻處理方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010737225.0 | 申請日: | 2020-07-28 |
| 公開(公告)號: | CN111899726A | 公開(公告)日: | 2020-11-06 |
| 發明(設計)人: | 李杰;成凱;郭少軍 | 申請(專利權)人: | 上海喜日電子科技有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L25/78;G10L25/84 |
| 代理公司: | 北京超凡宏宇專利代理事務所(特殊普通合伙) 11463 | 代理人: | 張磊 |
| 地址: | 201100 上海市*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 音頻 處理 方法 裝置 電子設備 存儲 介質 | ||
本申請實施例提供的音頻處理方法、裝置、電子設備及存儲介質。該音頻處理方法中,通過控制語音與干擾聲音兩者之間在持續時長上的差異,對獲取的音頻片段進行分析,確定出有效音頻片段。由于,由于能夠區分出音頻數據中的干擾聲音與控制語音,因此,能夠提高與設備語音交互過程中的準確率。
技術領域
本申請涉及數據處理領域,具體而言,涉及一種音頻處理方法、裝置、電子設備及存儲介質。
背景技術
用戶通過控制語音與設備進行交互時,環境中的其他干擾聲音會對用戶發出的控制語音造成一定的干擾。設備在進行語音交互時,難以區分其采集的音頻數據是否為控制語音,繼而影響語音交互的準確率。
發明內容
為了克服現有技術中的至少一個不足,本申請實施例的目的之一在于提供一種音頻處理方法,所述方法包括:
獲取語音控制時的音頻數據;
從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段,其中,在所述靜默時長內,該音頻數據對應的聲音強度不超過靜默閾值;
將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定超過該第二時長閾值的有效音頻片段。
可選地,所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定出超過該第二時長閾值的有效音頻片段的步驟,包括:
將所述待識別音頻片段的采集時長與所述第二時長閾值進行比較;
若所述待識別音頻片段的采集時長超過該第二時長閾值,則將所述待識別音頻片段確定為所述有效音頻片段:
若所述待識別音頻片段的采集時長不超過該第二時長閾值,則獲取新的音頻數據,再次從所述音頻數據中確定出靜默時長不超過第一時長閾值的待識別音頻片段的步驟執行。
可選地,所述從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的待識別音頻片段的步驟,包括:
從所述音頻數據中確定出每次靜默時長不超過第一時長閾值的至少一條待識別音頻片段;
所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較,確定超過該第二時長閾值的有效音頻片段的步驟,包括:
針對每條待識別音頻片段,將所述待識別音頻片段的錄音時長與所述第一時長閾值進行比較。
可選地,所述方法還包括:
統計多條有效語音片段的錄音時長;
根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值,獲得新的第二時長閾值。
可選地,所述根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值的步驟,包括:
根據所述多條有效語音的錄音時長,獲取所述多條有效語音的錄音時長的高斯分布;
根據所述高斯分布結果,確定出置信區間超過置信閾值的時長作為所述新的第二時長閾值。
可選地,所述根據所述多條有效語音片段的錄音時長的統計結果,調整所述第二時長閾值的步驟,包括:
將所述多條有效語音片段的錄音時長按照遞增或遞減的順序進行排序,獲得排序結果;
根據所述排序結果,選取所述排序結果中預設位置的錄音時長作為所述新的第二時長閾值。
可選地,記錄有聲紋信息與待匹配第二時長閾值的對應關系,所述將所述待識別音頻片段的采集時長與第二時長閾值進行比較之前,還包括:
獲取所述待識別音頻片段的聲紋信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海喜日電子科技有限公司,未經上海喜日電子科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010737225.0/2.html,轉載請聲明來源鉆瓜專利網。





