[發明專利]一種頻譜提取方法及裝置有效
| 申請號: | 201911424768.0 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111128228B | 公開(公告)日: | 2022-11-01 |
| 發明(設計)人: | 張添殳;吳金龍 | 申請(專利權)人: | 北京奇藝世紀科技有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/18 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 莎日娜 |
| 地址: | 100080 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 頻譜 提取 方法 裝置 | ||
1.一種頻譜提取方法,其特征在于,所述方法包括:
在預設的語音頻譜數據中,基于頻率與能量值的分布關系,查找對應的能量值處于峰值且頻率最低的樂音基本頻率;
基于所述分布關系以及所述樂音基本頻率,在所述語音頻譜數據中,查找樂音谷值頻率;
采用所述樂音谷值頻率,在所述語音頻譜數據中提取所述樂音谷值頻率對應的能量值;
基于所述樂音谷值頻率對應的能量值,對預設輕音頻率范圍內的頻率分配能量值,生成輕音頻譜數據;
其中,所述樂音基本頻率用于指示所述樂音中基音所在的頻率;所述基于所述分布關系以及所述樂音基本頻率,在所述語音頻譜數據中,查找樂音谷值頻率的步驟,包括:
基于所述樂音基本頻率,查找所述樂音中基音以外的分音所在的頻率;
基于所述樂音基本頻率以及分音所在的頻率,確定樂音的波形的周期;
基于所述樂音的波形的周期以及所述語音頻譜數據中頻率與能量值的分布關系,確定樂音的能量值處于谷值時對應的頻率,得到樂音谷值頻率。
2.根據權利要求1所述的方法,其特征在于,所述基于所述分布關系以及所述樂音基本頻率,在所述語音頻譜數據中,查找樂音谷值頻率的步驟,包括:
基于所述分布關系以及所述樂音基本頻率,在所述語音頻譜數據中,查找樂音峰值頻率;
基于所述分布關系以及所述樂音峰值頻率,在所述語音頻譜數據中,查找樂音谷值頻率。
3.根據權利要求2所述的方法,其特征在于,所述基于所述分布關系以及所述樂音基本頻率,在所述語音頻譜數據中,查找樂音峰值頻率的步驟,包括:
基于所述樂音基本頻率,確定與所述樂音基本頻率成倍數關系的第一頻率;
將所述第一頻率作為樂音峰值頻率;或者,基于所述分布關系,在所述語音頻譜數據中,查找對應的能量值在所述第一頻率的第一預設范圍內處于峰值的頻率,作為樂音峰值頻率。
4.根據權利要求2或3所述的方法,其特征在于,所述基于所述分布關系以及所述樂音峰值頻率,在所述語音頻譜數據中,查找樂音谷值頻率的步驟,包括:
基于所述樂音峰值頻率,確定在相鄰的所述樂音峰值頻率之間處于中位的第二頻率;
將所述第二頻率作為樂音谷值頻率;或者基于所述分布關系,在所述語音頻譜數據中,查找對應的能量值在所述第二頻率的第二預設范圍內處于谷值的頻率,作為樂音谷值頻率。
5.根據權利要求1所述的方法,其特征在于,所述在預設的語音頻譜數據中,基于頻率與能量值的分布關系,查找對應的能量值處于峰值且頻率最低的樂音基本頻率的步驟,包括:
在預設的語音頻譜數據中,基于頻率與能量值的分布關系,采用預設尺寸的滑動窗口,按序滑動所述滑動窗口,并計算在所述滑動窗口內的頻率范圍對應的平均能量值,得到平均能量值數組;
在所述平均能量值數組中,查找首個所述平均能量值處于峰值的目標平均能量值;
將所述目標平均能量值對應的所述頻率范圍中處于中位的頻率,作為樂音基本頻率。
6.根據權利要求2所述的方法,其特征在于,所述方法還包括:
采用所述樂音基本頻率、所述樂音峰值頻率、所述樂音谷值頻率,在所述語音頻譜數據中提取所述樂音基本頻率、所述樂音峰值頻率、所述樂音谷值頻率對應的能量值;
基于所述樂音基本頻率、所述樂音峰值頻率、所述樂音谷值頻率對應的能量值,對第四預設范圍內的頻率分配能量值,生成波形頻譜數據;
采用所述輕音頻譜數據,在所述波形頻譜數據中,去除輕音產生的能量值,得到樂音頻譜數據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京奇藝世紀科技有限公司,未經北京奇藝世紀科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911424768.0/1.html,轉載請聲明來源鉆瓜專利網。





