[發明專利]一種音頻數據處理方法及裝置在審
| 申請號: | 202011215284.8 | 申請日: | 2020-11-04 |
| 公開(公告)號: | CN112397073A | 公開(公告)日: | 2021-02-23 |
| 發明(設計)人: | 張宇飛;何選基;黃辰 | 申請(專利權)人: | 北京三快在線科技有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/14;G10L17/22;G10L25/45 |
| 代理公司: | 北京曼威知識產權代理有限公司 11709 | 代理人: | 方志煒 |
| 地址: | 100080 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 音頻 數據處理 方法 裝置 | ||
1.一種音頻數據處理方法,其特征在于,包括:
獲取歷史上采集的若干音頻數據;
針對每個音頻數據,確定該音頻數據中的人聲數據;
從所述人聲數據中確定若干預設時長的音頻數據,作為滑窗數據,其中,一個滑窗數據中包含若干幀音頻數據;
針對該人聲數據中的每個滑窗數據,對該滑窗數據進行音頻特征提取,并將提取到的音頻特征輸入預先訓練的語音分類模型中,確定該滑窗數據屬于正常人聲的概率;
根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,并根據確定出的各正常人聲數據,確定訓練樣本,所述訓練樣本用于訓練識別正常人聲的語音識別模型。
2.如權利要求1所述的方法,其特征在于,根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,具體包括:
根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據屬于正常人聲的概率;
當該人聲數據屬于正常人聲的概率大于第二預設閾值時,確定該人聲數據屬于正常人聲,并將該人聲數據作為正常人聲數據。
3.如權利要求1所述的方法,其特征在于,根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,具體包括:
針對該人聲數據中的每個滑窗數據,判斷該滑窗數據屬于正常人聲的概率是否大于第三預設閾值;
若是,確定該滑窗數據屬于正常人聲;
若否,確定該滑窗數據屬于非正常人聲;
根據確定出的該人聲數據中屬于正常人聲的各滑窗數據,確定該人聲數據中的正常人聲數據。
4.如權利要求1所述的方法,其特征在于,語音類型至少包含正常人聲以及電子人聲;
根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,具體包括:
針對該人聲數據中的每個滑窗數據,確定該滑窗數據屬于電子人聲的概率;
根據各滑窗數據屬于正常人聲的概率以及屬于電子人聲的概率,確定該人聲數據的概率矩陣;
根據確定出的該人聲數據的概率矩陣,通過解碼確定該人聲數據中正常人聲的起止時間;
根據該人聲數據中正常人聲的起止時間,確定該人聲數據中的正常人聲數據。
5.如權利要求1所述的方法,其特征在于,語音類型至少包含正常人聲以及電子人聲;
根據該人聲數據中各滑窗數據屬于正常人聲的概率,確定該人聲數據中的正常人聲數據,具體包括:
針對該人聲數據中的每個滑窗數據,確定該滑窗數據屬于電子人聲的概率;
根據該滑窗數據屬于正常人聲的概率以及屬于電子人聲的概率,確定該滑窗數據的概率矩陣;
將該滑窗數據的概率矩陣作為輸入,輸入預先訓練的概率分類模型,輸出該滑窗數據所屬語音類型;
根據該人聲數據中屬于正常人聲的各滑窗數據,確定該人聲數據中的正常人聲數據。
6.如權利要求1所述的方法,其特征在于,訓練語音分類模型,具體包括:
獲取歷史上采集的若干已標注的音頻數據,所述標注為音頻數據所屬的語音類型,所述語音類型至少包含正常人聲以及電子人聲;
針對獲取到的每個音頻數據,按照預設時長確定該音頻數據中包含的各滑窗數據,并提取各滑窗數據的音頻特征;
根據各音頻數據的標注,對各音頻數據中各滑窗數據的音頻特征進行標注,并將確定出的各滑窗數據的音頻特征及其標注,作為訓練樣本,其中,音頻特征的標注為所述音頻特征對應的滑窗數據屬于各語音類型的概率矩陣;
針對每個訓練樣本,將該訓練樣本包含的音頻特征輸入待訓練的語音分類模型,得到所述音頻特征對應的滑窗數據分別屬于各語音類型的概率矩陣;
以最小化所述模型輸出的概率矩陣與該訓練樣本中的標注之間的差異為目標,調整所述待訓練的語音分類模型中的參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京三快在線科技有限公司,未經北京三快在線科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011215284.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:廣告推送方法及系統
- 下一篇:一種基于zigbee系統的快速入網方法及系統





