[發(fā)明專利]發(fā)聲者識別方法、裝置、電子設(shè)備和存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 202111646838.4 | 申請日: | 2021-12-30 |
| 公開(公告)號: | CN114333846A | 公開(公告)日: | 2022-04-12 |
| 發(fā)明(設(shè)計)人: | 張學(xué)陽;高天 | 申請(專利權(quán))人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L17/02 | 分類號: | G10L17/02;G10L17/04;G10L17/18 |
| 代理公司: | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 44280 | 代理人: | 劉希 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 發(fā)聲 識別 方法 裝置 電子設(shè)備 存儲 介質(zhì) | ||
本申請公開了一種發(fā)聲者識別方法、裝置、電子設(shè)備和存儲介質(zhì)。其中,發(fā)聲者識別方法包括:提取發(fā)聲者的目標(biāo)聲紋表征;對目標(biāo)聲紋表征進行信道遷移,得到第一遷移聲紋表征,其中,目標(biāo)聲紋表征屬于第一信道,第一遷移聲紋表征和參考聲紋表征屬于第二信道;比對第一遷移聲紋表征與參考聲紋表征,以得到發(fā)聲者的識別結(jié)果。通過上述方式,本申請能夠提升發(fā)聲者識別結(jié)果的準(zhǔn)確率。
技術(shù)領(lǐng)域
本申請涉及技術(shù)語音技術(shù)領(lǐng)域,特別是涉及一種發(fā)聲者識別方法、裝置、電子設(shè)備和存儲介質(zhì)。
背景技術(shù)
發(fā)聲者識別是指利用發(fā)聲者的聲音來檢測發(fā)聲者的身份的技術(shù),例如聲紋識別技術(shù)。相比于其他生物識別技術(shù),發(fā)聲者識別利用語音信號進行身份確認,具有成本低廉、采集簡便、易于存儲、難于模仿、交互友好等特點,同時也可以通過電話或網(wǎng)絡(luò)等方式進行遠程操作。因此,發(fā)聲者識別在家居、安防、軍事、經(jīng)濟等很多領(lǐng)域都具有良好而廣闊的應(yīng)用前景。
發(fā)聲者識別按照應(yīng)用場景可以分為同信道場景和跨信道場景。發(fā)聲者注冊時的語音為參考語音,發(fā)聲者測試或應(yīng)用時的語音為目標(biāo)語音。同信道發(fā)聲者識別是指目標(biāo)語音和參考語音采用相同設(shè)備錄制,其中,目標(biāo)語音和參考語音屬于同一信道;跨信道發(fā)聲者識別是指目標(biāo)語音和參考語音采用不同設(shè)備進行錄制,即注冊和測試時的錄音設(shè)備發(fā)生了變化,即目標(biāo)語音和參考語音屬于不同的信道。由于跨信道的發(fā)聲者識別中引入了新的變量(信道),從而會影響發(fā)聲者識別效果。
目前,真實應(yīng)用場景中往往遇到跨信道場景的發(fā)聲者識別,因此解決這種跨信道場景的發(fā)聲者識別問題,提升發(fā)聲者識別效果,顯得尤為重要。
發(fā)明內(nèi)容
本申請主要解決的技術(shù)問題是提供一種發(fā)聲者識別方法、裝置、電子設(shè)備和存儲介質(zhì),能夠提升發(fā)聲者識別結(jié)果的準(zhǔn)確率。
為解決上述技術(shù)問題,本申請第一方面提供了一種發(fā)聲者識別方法,該方法包括:提取發(fā)聲者的目標(biāo)聲紋表征;對目標(biāo)聲紋表征進行信道遷移,得到第一遷移聲紋表征,其中,目標(biāo)聲紋表征屬于第一信道,第一遷移聲紋表征和參考聲紋表征屬于第二信道;比對第一遷移聲紋表征與參考聲紋表征,以得到發(fā)聲者的識別結(jié)果。
為解決上述技術(shù)問題,本申請第二方面提供了一種發(fā)聲者識別裝置,該裝置包括:提取模塊,用于提取發(fā)聲者的目標(biāo)聲紋表征;信道遷移模塊,用于對目標(biāo)聲紋表征進行信道遷移,得到第一遷移聲紋表征,其中,目標(biāo)聲紋表征屬于第一信道,第一遷移聲紋表征和參考聲紋表征屬于第二信道;比對模塊,用于比對第一遷移聲紋表征與參考聲紋表征,以得到發(fā)聲者的識別結(jié)果。
為解決上述技術(shù)問題,本申請第三方面提供了一種電子設(shè)備,該電子設(shè)備包括相互耦接的存儲器和處理器,存儲器用于存儲程序數(shù)據(jù),處理器用于執(zhí)行程序數(shù)據(jù)以實現(xiàn)前述的方法。
為解決上述技術(shù)問題,本申請第四方面提供了一種計算機可讀存儲介質(zhì),該計算機可讀存儲介質(zhì)中存儲有程序數(shù)據(jù),程序數(shù)據(jù)在被處理器執(zhí)行時,用以實現(xiàn)前述的方法。
本申請的有益效果是:區(qū)別于現(xiàn)有技術(shù)的情況,本申請通過提取發(fā)聲者的目標(biāo)聲紋表征,然后對目標(biāo)聲紋表征進行信道遷移,得到第一遷移聲紋表征,其中,目標(biāo)聲紋表征屬于第一信道,但是經(jīng)過信道遷移之后的第一遷移聲紋表征和參考聲紋表征屬于第二信道,由此,可以實現(xiàn)在同一信道下比對第一遷移聲紋表征與參考聲紋表征,得到發(fā)聲者的識別結(jié)果,解決了跨信道場景的發(fā)聲者識別問題,提升了發(fā)聲者識別結(jié)果的準(zhǔn)確率。
附圖說明
為了更清楚地說明本申請中的技術(shù)方案,下面將對實施例描述中所需要的附圖作簡單的介紹,顯而易見地,下面描述的附圖僅僅是本申請的一些實施例,對于本領(lǐng)域普通技術(shù)人員來說,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。其中:
圖1是本申請發(fā)聲者識別方法一實施例的流程示意圖;
圖2是圖1中步驟S11一實施方式的流程示意圖;
圖3是本申請發(fā)聲者識別方法一實施例的流程示意圖;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于科大訊飛股份有限公司,未經(jīng)科大訊飛股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111646838.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





