[發明專利]一種嬰兒語音基頻高精度提取方法、裝置及計算機設備有效
| 申請號: | 202110487291.1 | 申請日: | 2021-05-05 |
| 公開(公告)號: | CN113205827B | 公開(公告)日: | 2022-02-15 |
| 發明(設計)人: | 張茜 | 申請(專利權)人: | 張茜 |
| 主分類號: | G10L21/0308 | 分類號: | G10L21/0308;G10L25/03 |
| 代理公司: | 深圳國海智峰知識產權代理事務所(普通合伙) 44489 | 代理人: | 劉軍鋒 |
| 地址: | 561299 貴州省安順*** | 國省代碼: | 貴州;52 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 嬰兒 語音 基頻 高精度 提取 方法 裝置 計算機 設備 | ||
1.一種嬰兒語音基頻高精度提取方法,其特征在于,所述方法包括:
獲取嬰兒語音數據,按照預設語音分幀處理策略對所述嬰兒語音數據進行分幀處理,獲得若干幀時域上的分幀嬰兒語音數據;
將所述時域上的分幀嬰兒語音數據進行快速傅里葉變換后取絕對值,獲得頻域上的分幀嬰兒語音數據;
將所述頻域上的分幀嬰兒語音數據從中間位置處劃分為對稱的第一部分及第二部分,其中,第一部分為頻域上的分幀嬰兒語音數據的前半部分序列,第二部分為頻域上的分幀嬰兒語音數據的后半部分序列,將所述第一部分或所述第二部分定義為數組Z,根據預設計算策略對所述數組Z取對數,記為Zlog;
根據預設的自相關系數計算策略計算所述Zlog的自相關系數,根據所述Zlog的自相關系數獲得自相關系數-頻率圖譜,根據所述自相關系數-頻率圖譜中的諧波間距提取所述嬰兒語音數據的語音基頻。
2.根據權利要求1所述的嬰兒語音基頻高精度提取方法,其特征在于,所述按照預設語音分幀處理策略對所述嬰兒語音數據進行分幀處理包括:
對所述嬰兒語音數據進行預加重處理,提高所述嬰兒語音數據的高頻分辨率;
將進行預加重處理后的所述嬰兒語音數據,利用漢明窗進行分幀處理。
3.根據權利要求1所述的嬰兒語音基頻高精度提取方法,其特征在于,在將所述分幀嬰兒語音數據進行快速傅里葉變換后取絕對值,獲得頻域上的分幀嬰兒語音數據前,所述方法還包括:
預先計算所述分幀嬰兒語音數據中的各個數據分度的正弦值以及余弦值,并將各個數據分度的正弦值以及余弦值存為數組,在將所述分幀嬰兒語音數據進行快速傅里葉變換時,利用所述數組進行快速傅里葉變換。
4.根據權利要求1所述的嬰兒語音基頻高精度提取方法,其特征在于,每一幀分幀嬰兒語音數據的采樣頻率為8820Hz,采樣點為256個。
5.根據權利要求4所述的嬰兒語音基頻高精度提取方法,其特征在于,所述根據預設計算策略對所述數組Z取對數,記為Zlog包括:
預先存儲m=1024:128:33664的自然對數結果n,其中m=1024:128:33664為m從1024開始,以128為步進,至33664結束的256個數據,依次表示為m0、m1、m2……m255,m0、m1、m2……m255的自然對數結果依次表示為n0、n1、n2……n255;
利用公式ln(Z)=ln(Z*et)-t,對ln(Z)進行變形,令Z’=Z*et,Z’在[m0,m255]區間內,t為整數;
確定Z’所在的精確區間[mq,mq+1],q為[0,255]中的整數;
獲取mq的自然對數結果nq,根據公式ln(Z’)=nq+(Z’-mq)/mq以及公式ln(Z)=ln(Z’)-t,計算得到ln(Z)作為將所述數組Z取對數的結果Zlog。
6.根據權利要求1所述的嬰兒語音基頻高精度提取方法,其特征在于,所述將所述時域上的分幀嬰兒語音數據進行快速傅里葉變換后取絕對值為利用牛頓迭代法計算絕對值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于張茜,未經張茜許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110487291.1/1.html,轉載請聲明來源鉆瓜專利網。





