[發明專利]一種音頻數據處理方法及裝置在審
| 申請號: | 202011215284.8 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN112397073A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 張宇飛;何選基;黃辰 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/14;G10L17/22;G10L25/45 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 方志煒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 數據處理 方法 裝置 | ||
本說明書公開了一種音頻數據處理方法及裝置,可先獲取歷史采集的各音頻數據,并確定各音頻數據中的人聲數據。之后,確定該人聲數據中包含的各滑窗數據,并針對每個人聲數據中的每個滑窗數據,進行音頻特征提取,將提取到的音頻特征輸入語音分類模型中,確定該滑窗數據屬于正常人聲的概率。最后,基于該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,以確定訓練樣本。通過對音頻數據進行音頻特征提取,并基于提取到的音頻特征進行語音分類的方式,從各人聲數據中確定出正常人聲數據,并將確定出的正常人聲數據作為訓練語音識別模型的訓練樣本,提高了訓練樣本的準確率,進一步提高語音識別模型的訓練精度。
技術領域
本申請涉及語音識別技術領域,尤其涉及一種音頻數據處理方法及裝置。
背景技術
隨著人工智能的發展,語音識別作為實現人機之間交流的關鍵技術也得到廣泛應用。通過語音識別模型將人聲轉換為文本,以使機器根據文本指令執行任務。
目前,在對語音識別模型進行訓練時,通常需要預先采集包含人聲的音頻數據作為訓練樣本,并人工識別各音頻數據的文本內容,作為各訓練樣本的標注,以根據各訓練樣本及其標注對語音識別模型進行訓練。
由于各音頻數據的采集環境復雜,采集到的各音頻數據中還可能包含環境噪聲、背景雜音等非人聲音頻,因此為提高語音識別模型的訓練精度,在進行模型訓練之前,還需對采集到的各音頻數據進一步進行處理。具體的,針對作為訓練樣本的每個音頻數據,根據該音頻數據的頻譜信息(包含聲音的響度以及頻率)、標準的人聲頻率范圍以及響度范圍,從該音頻數據中確定人聲音頻的起止時間,以截取得到僅包含人聲的音頻數據,作為訓練樣本,用于訓練語音識別模型。
發明內容
本說明書實施例提供一種音頻數據處理方法及裝置,用于部分解決現有技術獲取到的作為訓練樣本的音頻數據的準確度低,導致模型訓練精度較低的問題。
本說明書實施例采用下述技術方案:
本說明書提供的一種音頻數據處理方法,包括:
獲取歷史上采集的若干音頻數據;
針對每個音頻數據,確定該音頻數據中的人聲數據;
從所述人聲數據中確定若干預設時長的音頻數據,作為滑窗數據,其中,一個滑窗數據中包含若干幀音頻數據;
針對該人聲數據中的每個滑窗數據,對該滑窗數據進行音頻特征提取,并將提取到的音頻特征輸入預先訓練的語音分類模型中,確定該滑窗數據屬于正常人聲的概率;
根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,并根據確定出的各正常人聲數據,確定訓練樣本,所述訓練樣本用于訓練識別正常人聲的語音識別模型。
可選地,根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,具體包括:
根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據屬于正常人聲的概率;
當該人聲數據屬于正常人聲的概率度大于第二預設閾值時,確定該人聲數據屬于正常人聲,并將該人聲數據作為正常人聲數據。
可選地,根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,具體包括:
針對該人聲數據中的每個滑窗數據,判斷該滑窗數據屬于正常人聲的概率是否大于第三預設閾值;
若是,確定該滑窗數據屬于正常人聲;
若否,確定該滑窗數據屬于非正常人聲;
根據確定出的該人聲數據中的各幀屬于正常人聲的各滑窗數據,確定該人聲數據中的正常人聲數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011215284.8/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:廣告推送方法及系統
- 下一篇:一種基于zigbee系統的快速入網方法及系統





