[發明專利]基于神經網絡的聲紋識別系統的最優碼本設計方法無效
| 申請號: | 201210314067.3 | 申請日: | 2012-08-30 |
| 公開(公告)號: | CN102800316A | 公開(公告)日: | 2012-11-28 |
| 發明(設計)人: | 李勇明;施忠繼;王品;鄒雪;梅林 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L17/00 |
| 代理公司: | 重慶市前沿專利事務所 50211 | 代理人: | 郭云 |
| 地址: | 400044 *** | 國省代碼: | 重慶;85 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 神經網絡 聲紋 識別 系統 最優 設計 方法 | ||
1.一種基于神經網絡的聲紋識別系統的最優碼本設計方法,包括:
S1:用于語音信號輸入的步驟;
S2:對輸入的語音信號段進行預處理的步驟;
S3:對預處理后的語音信號段提取特征參數的步驟;
其特征在于,還包括:
S4:用于生成三個初始碼本的步驟,該步驟中第一初始碼本采用矢量量化法生成,第二初始碼本采用遺傳算法生成,第三初始碼本先采用矢量量化法,再采用遺傳算法生成;
S5:用于神經網絡訓練的步驟,該步驟中利用神經網絡分別對三個初始碼本進行訓練,得到第一初始碼本識別正確率、第二初始碼本識別正確率以及第三初始碼本識別正確率;
S6:用于選擇最優碼本的步驟,該步驟中選擇三個初始碼本中識別正確率最高的一個初始碼本作為輸入的語音信號段的最優碼本。
2.根據權利要求1所述的基于神經網絡的聲紋識別系統的最優碼本設計方法,其特征在于:所述步驟S2中,對輸入的語音信號段進行預處理包括預加重以及分幀,其中分幀采用交疊分段方法,幀長為256(32ms),幀移為100(12.5ms)。
3.根據權利要求1所述的基于神經網絡的聲紋識別系統的最優碼本設計方法,其特征在于:所述特征參數為梅爾頻率倒譜系數與線性預測倒譜系數的混合特征參數。
4.根據權利要求3所述的基于神經網絡的聲紋識別系統的最優碼本設計方法,其特征在于:混合特征參數提取方法是將語音信號段的每一幀等分為兩部分,將該語音信號段中所有幀的前半部分提取梅爾頻率倒譜系數,將該語音信號段中所有幀的后半部分提取線性預測倒譜系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210314067.3/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:三相整流模塊
- 下一篇:一種用于硅通孔技術的預浸潤裝置





