[發明專利]用以估計失真程度的方法及系統在審
| 申請號: | 202211375327.8 | 申請日: | 2022-11-04 |
| 公開(公告)號: | CN116074721A | 公開(公告)日: | 2023-05-05 |
| 發明(設計)人: | 艾塔·巴凱;伊塔馬爾·塔米爾 | 申請(專利權)人: | 新唐科技股份有限公司 |
| 主分類號: | H04R29/00 | 分類號: | H04R29/00;G06N3/04;G06N3/08;G06N20/00 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 王濤 |
| 地址: | 中國臺灣新竹*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用以 估計 失真 程度 方法 系統 | ||
1.一種用以估計失真程度的系統,其特征在于,包括:
一存儲器,被配置以儲存一機器學習模型;以及
一處理器,被配置以:
取得多個訓練音頻信號,所述多個訓練音頻信號的每一個被標注一失真程度;
將所述多個訓練音頻信號分別轉換為多個第一圖像;
訓練所述機器學習模型基于從所述多個第一圖像估計所述多個訓練音頻信號的所述失真程度;
接收一輸入音頻信號;
將所述輸入音頻信號轉換為一第二圖像;以及
將所述第二圖像應用于所訓練過的所述機器學習模型,以估計所述輸入音頻信號的失真程度。
2.一種用以估計失真程度的系統,其特征在于,包括:
一存儲器,被配置以儲存一機器學習模型;以及
一處理器,被配置以:
取得多個初始音頻信號,所述多個初始音頻信號具有在一第一時間長度范圍內的第一時間長度,并且所述多個初始音頻信號的每一個被標注一失真程度;
將所述多個初始音頻信號切割成具有在一第二時間長度范圍內的第二時間長度的多個片段,所述第二時間長度小于所述第一時間長度,以便產生多個訓練音頻信號;
訓練所述機器學習模型基于所述多個訓練音頻信號估計所述多個訓練音頻信號的所述失真程度;
接收具有在所述第二時間長度范圍內的一時間長度的一輸入音頻信號;以及
將所述輸入音頻信號應用于所訓練過的所述機器學習模型,估計所述輸入音頻信號的所述失真程度。
3.如權利要求1所述的用以估計失真程度的系統,其特征在于,所述處理器被配置以通過設定一給定的圖像的多個像素的值以表示一給定的訓練音頻信號的振幅對時間的一函數,將所述給定的訓練音頻信號轉換為所述給定的圖像。
4.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述多個第一圖像及所述第二圖像是二維(2D)的。
5.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述多個第一圖像及所述第二圖像是三維或更多維的。
6.如權利要求1所述的用以估計失真程度的系統,其特征在于,所述處理器被配置以通過(i)接收具有第一時間長度的多個初始音頻信號,以及(ii)將所述初始音頻信號切割成具有第二時間長度的多個片段,所述第二時間長度小于所述第一時間長度,而取得所述多個訓練音頻信號,以便于產生所述多個訓練音頻信號。
7.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述機器學習模型包含一卷積神經網絡(CNN)或一生成對抗網絡(GAN)。
8.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述輸入音頻信號來自非線性音頻處理電路。
9.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述機器學習模型根據所述多個訓練音頻信號所標注的所述失真程度,將所述失真程度進行分類。
10.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述機器學習模型使用回歸估計所述失真程度。
11.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述處理器更被配置以使用所估計出的所述輸入音頻信號的所述失真程度,來控制產生所述輸入音頻信號的一音頻系統。
12.如權利要求1或2所述的用以估計失真程度的系統,其特征在于,所述失真程度為一總諧波失真(THD)的程度。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于新唐科技股份有限公司,未經新唐科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211375327.8/1.html,轉載請聲明來源鉆瓜專利網。





