[發明專利]語音數據處理方法、裝置、電子設備及可讀存儲介質有效
| 申請號: | 201810049575.0 | 申請日: | 2018-01-18 |
| 公開(公告)號: | CN108269579B | 公開(公告)日: | 2020-11-10 |
| 發明(設計)人: | 卓鵬鵬;張康;方博偉;尤嘉華;張偉 | 申請(專利權)人: | 廈門美圖之家科技有限公司 |
| 主分類號: | G10L21/013 | 分類號: | G10L21/013 |
| 代理公司: | 北京超凡志成知識產權代理事務所(普通合伙) 11371 | 代理人: | 蘇勝 |
| 地址: | 361008 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 數據處理 方法 裝置 電子設備 可讀 存儲 介質 | ||
1.一種語音數據處理方法,其特征在于,包括:
獲取語音數據及目標MIDI音頻,所述語音數據包括與所述目標MIDI音頻對齊后的語音;
獲得所述語音數據的初始頻域參數;
獲得與預設的目標MIDI音頻對應的目標頻域參數,其中所述初始頻域參數包括所述語音數據的初始相位,所述目標頻域參數包括與所述目標MIDI音頻對應的目標相位;
根據所述目標頻域參數對所述初始頻域參數進行修改,將所述語音數據中的音高變換到所述目標MIDI音頻中的目標音高,得到變調后的語音數據;
所述根據所述目標頻域參數對所述初始頻域參數進行修改的步驟,包括:
將所述語音數據中濁音的初始相位替換為對應的目標波形的相位值。
2.根據權利要求1所述的語音數據處理方法,其特征在于,獲得語音數據的初始頻域參數的步驟包括:
獲取所述語音數據中與所述目標音高對應時間上的語音數據;
對與所述目標音高對應時間上的語音數據進行去零點漂移和預加重處理;
對經過去零點漂移和預加重處理的語音數據進行時頻轉換,得到所述語音數據每一幀的頻域參數。
3.根據權利要求2所述的語音數據處理方法,其特征在于,對經過去零點漂移和預加重處理的語音數據進行時頻轉換的步驟包括:
計算所述語音數據中每一幀的幀移;
根據計算得到的幀移及預設的窗函數對所述語音數據進行分幀、加窗;
將分幀、加窗后的每一幀語音數據進行傅里葉變換,得到所述語音數據中每一幀的頻域參數。
4.根據權利要求3所述的語音數據處理方法,其特征在于,計算所述語音數據中每一幀的幀移的步驟包括:
利用采樣率除以目標頻率得到每一幀的幀移,其中所述目標頻率為所述目標MIDI音頻的頻率,目標頻率采用以下公式計算得到:
其中,F為所述目標MIDI音頻的目標頻率,MIDINote為所述目標MIDI音頻包括的音高值。
5.根據權利要求1所述的語音數據處理方法,其特征在于,所述目標MIDI音頻記錄有聲音的目標頻率,獲得與預設的目標MIDI音頻對應的目標頻域參數的步驟包括:
生成與所述目標頻率相同音高的,且與該目標頻率對應的語音數據等時長的目標波形;
提取所述目標波形的相位值,作為所述目標頻域參數;
相應的,根據所述目標MIDI音頻的頻域參數對所述語音數據的頻域參數進行修改的步驟包括:
將所述語音數據中與該目標波形對應位置的語音數據的相位值替換為所述目標波形的相位值,得到變調后的語音數據的頻域參數;
對變調后的語音數據的頻域參數進行逆傅里葉變換,并通過OLA重疊疊加算法處理后得到變調后的語音數據。
6.一種語音數據處理裝置,其特征在于,包括:
數據獲取模塊,用于獲取語音數據及目標MIDI音頻,所述語音數據包括與所述目標MIDI音頻對齊后的語音;
語音數據處理模塊,用于獲得所述語音數據的初始頻域參數;
目標MIDI音頻處理模塊,獲得與預設的目標MIDI音頻對應的目標頻域參數,其中所述初始頻域參數包括所述語音數據的初始相位,所述目標頻域參數包括與所述目標MIDI音頻對應的目標相位;
變調模塊,用于根據所述目標頻域參數對所述初始頻域參數進行修改,將所述語音數據中的音高變換到所述目標MIDI音頻中的目標音高,得到變調后的語音數據;
所述變調模塊還用于將所述語音數據中濁音的初始相位替換為對應的目標波形的相位值。
7.根據權利要求6所述的語音數據處理裝置,其特征在于,所述語音數據處理模塊獲得語音數據的初始頻域參數的方法包括:
對所述語音數據進行去零點漂移和預加重處理;
對經過去零點漂移和預加重處理的語音數據進行時頻轉換,得到所述語音數據每一幀的頻域參數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門美圖之家科技有限公司,未經廈門美圖之家科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810049575.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:用于處理信息的方法和裝置
- 下一篇:回聲消除方法及裝置





