[發(fā)明專(zhuān)利]一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 202210924489.6 | 申請(qǐng)日: | 2022-08-03 |
| 公開(kāi)(公告)號(hào): | CN115019804B | 公開(kāi)(公告)日: | 2022-11-01 |
| 發(fā)明(設(shè)計(jì))人: | 何肖肖 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京惠朗時(shí)代科技有限公司 |
| 主分類(lèi)號(hào): | G10L17/02 | 分類(lèi)號(hào): | G10L17/02;G10L17/20;G10L21/0208;G07C1/10 |
| 代理公司: | 成都魚(yú)爪智云知識(shí)產(chǎn)權(quán)代理有限公司 51308 | 代理人: | 鄭發(fā)志 |
| 地址: | 102600 北京市大興區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 員工 密集 簽到 多重 校驗(yàn) 聲紋 識(shí)別 方法 系統(tǒng) | ||
1.一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別方法,其特征在于,包括以下步驟:
錄入員工簽到音頻;
將員工簽到音頻進(jìn)行多次不同的多等分分段,以得到多次分段后的多段音頻數(shù)據(jù),包括:將員工簽到音頻進(jìn)行N等分分段,以得到N段音頻數(shù)據(jù);將員工簽到音頻進(jìn)行N-1等分分段,以得到N-1段音頻數(shù)據(jù);將員工簽到音頻進(jìn)行N-2等分分段,以得到N-2段音頻數(shù)據(jù);其中,N大于等于4;
對(duì)各次分段后的多段音頻數(shù)據(jù)進(jìn)行音頻編碼,以得到各次分段后的多段編碼音頻;
計(jì)算并根據(jù)各次分段后的各段編碼音頻兩兩之間的相似度確定目標(biāo)員工簽到音頻,包括:計(jì)算并根據(jù)各次分段后的各段編碼音頻兩兩之間的歐式距離確定各次分段后的各段編碼音頻兩兩之間的相似度;判斷各次分段后的各段編碼音頻兩兩之間的相似度是否有至少一個(gè)相似度小于預(yù)置的參考閾值,如果是,則生成干擾提示信息,并重新錄入員工簽到音頻;如果否,則將錄入的員工簽到音頻作為目標(biāo)員工簽到音頻;
采用多種聲紋識(shí)別方法分別對(duì)目標(biāo)員工簽到音頻進(jìn)行識(shí)別,以得到多個(gè)識(shí)別結(jié)果;
判斷多個(gè)識(shí)別結(jié)果是否相同,如果是,則生成簽到識(shí)別成功信息;如果否,則生成簽到失敗提示信息,并重新錄入員工簽到音頻。
2.根據(jù)權(quán)利要求1所述的一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別方法,其特征在于,還包括以下步驟:
利用小波音頻去噪方法對(duì)錄入的員工簽到音頻進(jìn)行去噪,以得到去噪后的員工簽到音頻。
3.根據(jù)權(quán)利要求1所述的一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別方法,其特征在于,所述采用多種聲紋識(shí)別方法分別對(duì)目標(biāo)員工簽到音頻進(jìn)行識(shí)別的方法包括以下步驟:
采用GMM-UBM和GMM-SVM兩種聲紋識(shí)別方法分別對(duì)目標(biāo)員工簽到音頻進(jìn)行識(shí)別。
4.根據(jù)權(quán)利要求1所述的一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別方法,其特征在于,所述采用多種聲紋識(shí)別方法分別對(duì)目標(biāo)員工簽到音頻進(jìn)行識(shí)別的方法包括以下步驟:
采用d-vector和ivector+PLDA/CDS兩種聲紋識(shí)別方法分別對(duì)目標(biāo)員工簽到音頻進(jìn)行識(shí)別。
5.一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別系統(tǒng),其特征在于,包括音頻錄入模塊、分段模塊、編碼模塊、相似度計(jì)算模塊、聲紋識(shí)別模塊以及識(shí)別判斷模塊,其中:
音頻錄入模塊,用于錄入員工簽到音頻;
分段模塊,用于將員工簽到音頻進(jìn)行多次不同的多等分分段,以得到多次分段后的多段音頻數(shù)據(jù),包括:將員工簽到音頻進(jìn)行N等分分段,以得到N段音頻數(shù)據(jù);將員工簽到音頻進(jìn)行N-1等分分段,以得到N-1段音頻數(shù)據(jù);將員工簽到音頻進(jìn)行N-2等分分段,以得到N-2段音頻數(shù)據(jù);其中,N大于等于4;
編碼模塊,用于對(duì)各次分段后的多段音頻數(shù)據(jù)進(jìn)行音頻編碼,以得到各次分段后的多段編碼音頻;
相似度計(jì)算模塊,用于計(jì)算并根據(jù)各次分段后的各段編碼音頻兩兩之間的相似度確定目標(biāo)員工簽到音頻,包括:計(jì)算并根據(jù)各次分段后的各段編碼音頻兩兩之間的歐式距離確定各次分段后的各段編碼音頻兩兩之間的相似度;判斷各次分段后的各段編碼音頻兩兩之間的相似度是否有至少一個(gè)相似度小于預(yù)置的參考閾值,如果是,則生成干擾提示信息,并重新錄入員工簽到音頻;如果否,則將錄入的員工簽到音頻作為目標(biāo)員工簽到音頻;
聲紋識(shí)別模塊,用于采用多種聲紋識(shí)別方法分別對(duì)目標(biāo)員工簽到音頻進(jìn)行識(shí)別,以得到多個(gè)識(shí)別結(jié)果;
識(shí)別判斷模塊,用于判斷多個(gè)識(shí)別結(jié)果是否相同,如果是,則生成簽到識(shí)別成功信息;如果否,則生成簽到失敗提示信息,并重新錄入員工簽到音頻。
6.根據(jù)權(quán)利要求5所述的一種多員工密集簽到的多重校驗(yàn)式聲紋識(shí)別系統(tǒng),其特征在于,還包括去噪模塊,用于利用小波音頻去噪方法對(duì)錄入的員工簽到音頻進(jìn)行去噪,以得到去噪后的員工簽到音頻。
7.一種電子設(shè)備,其特征在于,包括:
存儲(chǔ)器,用于存儲(chǔ)一個(gè)或多個(gè)程序;
處理器;
當(dāng)所述一個(gè)或多個(gè)程序被所述處理器執(zhí)行時(shí),實(shí)現(xiàn)如權(quán)利要求1-4中任一項(xiàng)所述的方法。
8.一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,其特征在于,該計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1-4中任一項(xiàng)所述的方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京惠朗時(shí)代科技有限公司,未經(jīng)北京惠朗時(shí)代科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210924489.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)





