[發(fā)明專利]基于語音圖譜和深度學(xué)習(xí)的實(shí)時(shí)性別識別方法在審
| 申請?zhí)枺?/td> | 201910612980.3 | 申請日: | 2019-07-09 |
| 公開(公告)號: | CN110211569A | 公開(公告)日: | 2019-09-06 |
| 發(fā)明(設(shè)計(jì))人: | 王磊 | 申請(專利權(quán))人: | 浙江百應(yīng)科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/06;G10L25/30;G10L25/51;G10L25/78 |
| 代理公司: | 北京科億知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11350 | 代理人: | 湯東鳳 |
| 地址: | 311121 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 性別識別 語音 圖譜 數(shù)字特征 音頻流 建立模型 實(shí)時(shí)獲取 性別預(yù)測 學(xué)習(xí)算法 語音對話 語音識別 準(zhǔn)確率 靜音 切除 學(xué)習(xí) 轉(zhuǎn)換 | ||
1.基于語音圖譜和深度學(xué)習(xí)的實(shí)時(shí)性別識別方法,其特征在于,包括以下步驟:
S1:基于深度學(xué)習(xí)算法建立模型;
S2:語音對話過程中實(shí)時(shí)獲取音頻流;
S3:將獲取的音頻流通過VAD切除靜音部分;
S4:通過fbank提取音頻的數(shù)字特征;
S5:將數(shù)字特征轉(zhuǎn)換成語音圖譜,將語音圖譜通過模型進(jìn)行性別預(yù)測,得到性別識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于語音圖譜和深度學(xué)習(xí)的實(shí)時(shí)性別識別方法,其特征在于,所述基于深度學(xué)習(xí)算法建立模型包括以下步驟:
S11:語音圖譜結(jié)合打標(biāo)標(biāo)簽生成樣本信息,按照設(shè)定比例劃分訓(xùn)練集合和測試集合;
S12:對語音圖譜作歸一化和正則化處理,保存樣本集合的均值和方差信息;
S13:將訓(xùn)練集合輸入給下游的resnet網(wǎng)絡(luò),重新訓(xùn)練網(wǎng)絡(luò)最后一層和softmax層,多次循環(huán),不斷擬合神經(jīng)網(wǎng)絡(luò)的相關(guān)參數(shù),直到損失達(dá)到閥值或者迭代次數(shù)達(dá)到預(yù)設(shè)值;
S14:用測試集合進(jìn)行測試,若模型準(zhǔn)確度達(dá)到預(yù)期值,則輸出模型,否則調(diào)整參數(shù)或者樣本信息重新訓(xùn)練模型。
3.根據(jù)權(quán)利要求1所述的基于語音圖譜和深度學(xué)習(xí)的實(shí)時(shí)性別識別方法,其特征在于,所述語音圖譜包括若干個(gè)768*32的二維數(shù)字矩陣。
4.根據(jù)權(quán)利要求3所述的基于語音圖譜和深度學(xué)習(xí)的實(shí)時(shí)性別識別方法,其特征在于,所述語音圖譜包括音頻流的頻域和時(shí)域信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江百應(yīng)科技有限公司,未經(jīng)浙江百應(yīng)科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910612980.3/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種語音識別方法及裝置
- 下一篇:同聲傳譯處理方法、裝置及設(shè)備
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計(jì)算機(jī)設(shè)備
- 一種支持增量實(shí)體關(guān)聯(lián)的關(guān)系圖譜計(jì)算方法
- 基于計(jì)算提取數(shù)字圖像選擇性骨骼面積特征的數(shù)字識別方法
- 一種隨機(jī)數(shù)字防偽方法
- 基于綜合特征的數(shù)字資源監(jiān)測預(yù)警方法
- 基于數(shù)字檔案資源綜合特征的數(shù)字水印生成與嵌入方法
- 一種手寫數(shù)字識別方法、裝置、設(shè)備及可讀存儲介質(zhì)
- 數(shù)字牌照的電子可讀顯示特征
- 基于殘差學(xué)習(xí)卷積融合網(wǎng)絡(luò)的數(shù)字圖像設(shè)備取證系統(tǒng)
- 一種基于特征降維的手寫數(shù)字識別方法
- 數(shù)字圖像文件查詢方法、裝置及可讀存儲介質(zhì)
- 數(shù)字人體試衣方法及系統(tǒng)





