[發明專利]基頻獲取方法、裝置、計算機設備和存儲介質有效
| 申請號: | 202110069325.5 | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112885367B | 公開(公告)日: | 2022-04-08 |
| 發明(設計)人: | 黃榮均 | 申請(專利權)人: | 珠海市杰理科技股份有限公司 |
| 主分類號: | G10L21/0208 | 分類號: | G10L21/0208;G10L19/16;G10L19/26;G10L15/14;G10L15/16 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 盧曉霞 |
| 地址: | 519000 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基頻 獲取 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種基頻獲取方法,其特征在于,所述方法包括:
獲取時域音頻信號;
利用預設的濾波器組對所述時域音頻信號進行濾波處理,得到語音信號;
確定具有預設窗口大小的自相關窗口;
利用所述自相關窗口獲取所述語音信號的歸一化自相關特征;
將所述歸一化自相關特征輸入至預先構建的特征提取模型中的編碼器,以使所述編碼器對所述歸一化自相關特征進行降維處理,得到具有預設維度的所述歸一化自相關特征對應的降維特征;所述將所述歸一化自相關特征輸入至預先構建的特征提取模型中的編碼器之前,還包括:獲取樣本音頻信號的樣本歸一化自相關特征;將所述樣本歸一化自相關特征輸入待訓練的自編碼器模型的編碼器,以使所述編碼器的編碼器權值對所述樣本歸一化自相關特征進行降維處理,得到預設維度的所述樣本歸一化自相關特征對應的樣本降維特征;將所述樣本降維特征輸入所述自編碼器模型的解碼器,以使所述解碼器的解碼器權值對所述樣本降維特征進行升維處理,將所述樣本降維特征的維度恢復為所述樣本歸一化自相關特征的維度,得到樣本升維特征;獲取所述樣本歸一化自相關特征與所述樣本升維特征的均方誤差;若所述均方誤差小于等于第一誤差閾值,則將所述自編碼器模型作為所述特征提取模型;
將所述降維特征輸入至預先構建的由預設數量的全連接層組成的基頻獲取模型,以使所述基頻獲取模型輸出所述降維特征對應的目標基頻類別;
基于預設的基頻類別與基頻頻率之間的對應關系,確定所述目標基頻類別對應的目標基頻頻率,將所述目標基頻頻率作為所述時域音頻信號的基頻頻率。
2.根據權利要求1所述的方法,其特征在于,所述濾波器組包括多個濾波器通道;所述多個濾波器通道對應于多個濾波器函數;
所述得到語音信號,包括:
確定各濾波器通道對應的濾波器函數;
利用所述各濾波器通道對應的濾波器函數對所述時域音頻信號進行濾波處理,獲取所述各濾波器通道對應的子語音信號,得到多個子語音信號;
所述利用所述自相關窗口獲取所述語音信號的歸一化自相關特征,包括:
利用所述自相關窗口獲取各子語音信號的歸一化子自相關特征,得到多個歸一化子自相關特征;
所述將所述歸一化自相關特征輸入至預先構建的特征提取模型中的編碼器,包括:
將所述多個歸一化子自相關特征輸入所述編碼器。
3.根據權利要求2所述的方法,其特征在于,所述利用所述自相關窗口獲取各子語音信號的歸一化子自相關特征,得到多個歸一化子自相關特征,包括:
獲取預設的自相關特征提取周期;
根據所述自相關特征提取周期,以及所述預設窗口大小,獲取所述各子語音信號的所述歸一化子自相關特征。
4.根據權利要求3所述的方法,其特征在于,所述確定具有預設窗口大小的自相關窗口,包括:
獲取預設的第一基頻頻率,以及預設的對所述時域音頻信號進行采樣的采樣頻率;
根據所述第一基頻頻率以及所述采樣頻率確定所述自相關窗口的窗口大小。
5.根據權利要求1至4任一項所述的方法,其特征在于,所述將所述降維特征輸入至預先構建的由預設數量的全連接層組成的基頻獲取模型,以使所述基頻獲取模型輸出所述降維特征對應的目標基頻類別,包括:
將所述降維特征輸入至所述基頻獲取模型,以使所述基頻獲取模型獲取所述降維特征對應的預測概率向量;所述預測概率向量用于表征所述降維特征屬于預先設定的多個基頻類別的預測概率;
將所述預測概率向量輸入隱馬爾可夫模型,從所述多個基頻類別中確定所述目標基頻類別。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海市杰理科技股份有限公司,未經珠海市杰理科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110069325.5/1.html,轉載請聲明來源鉆瓜專利網。





