[發(fā)明專利]一種聲紋識別相似度評分的方法和裝置有效
申請?zhí)枺?/td> | 201511016012.4 | 申請日: | 2015-12-29 |
公開(公告)號: | CN105679324B | 公開(公告)日: | 2019-03-22 |
發(fā)明(設(shè)計)人: | 黃建鵬;蔡智力;王子亮;王捷;鄒應(yīng)雙 | 申請(專利權(quán))人: | 福建星網(wǎng)視易信息系統(tǒng)有限公司 |
主分類號: | G10L17/08 | 分類號: | G10L17/08;G10L17/12;G10L17/02;G10L17/04 |
代理公司: | 福州市景弘專利代理事務(wù)所(普通合伙) 35219 | 代理人: | 林祥翔;呂元輝 |
地址: | 350008 福建省福州市倉山區(qū)金山*** | 國省代碼: | 福建;35 |
權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關(guān)鍵詞: | 一種 聲紋 識別 相似 評分 方法 裝置 | ||
本發(fā)明公開一種聲紋識別相似度評分方法和裝置,其中方法包括如下步驟:獲取聲紋數(shù)據(jù),并將聲紋數(shù)據(jù)與語料庫中所有的聲音模型進(jìn)行匹配,得到第二聲紋識別得分集合;語料庫中的各個對象的語料子集中挑選若干音頻數(shù)據(jù)與語料庫中所有的聲音模型進(jìn)行匹配,得到各自的第一聲紋識別得分集合;根據(jù)第二聲紋識別得分集合的高低順序分配對應(yīng)的第一得分系數(shù)集合;根據(jù)第一聲紋識別得分集合和第二聲紋識別得分集合計算對應(yīng)的第二得分系數(shù)集合。本發(fā)明通過第一聲紋識別得分和第二聲紋識別得分并算上權(quán)重,對聲紋識別進(jìn)行綜合性評定,使得評定的得分結(jié)果穩(wěn)定,區(qū)分度高,不易出現(xiàn)聲紋識別結(jié)果相差大的問題。
技術(shù)領(lǐng)域
本發(fā)明涉及聲紋識別技術(shù)領(lǐng)域,尤其涉及一種聲紋識別相似度評分的方法和裝置。
背景技術(shù)
由于歌曲演唱(singing)相對于自然人說話的語音(voice)更為多變和復(fù)雜,歌曲演唱雖然也是由人的聲道產(chǎn)生聲音,但是無論現(xiàn)實演唱還是語料庫的歌曲干聲語料,都含有音樂伴奏帶來的干擾,且目前并沒有相關(guān)技術(shù)可以將音樂和人聲完美分離,因此現(xiàn)有聲紋識別技術(shù)應(yīng)用于歌曲演唱進(jìn)行歌唱者識別或者計算相似度時,評分結(jié)果不穩(wěn)定,如,同一個人多次演唱相同或不同歌曲,相關(guān)聲紋識別得分會出現(xiàn)很大的不同。通常需要得到相對一致的得分時,一方面要求演唱者能夠以穩(wěn)定的音色或演唱技巧進(jìn)行演唱,并且不含過多背景音樂,如KTV場合,另一方面要求語料庫的歌曲干聲盡量純凈,即不含過多音樂伴奏。而上述兩方面是比較難辦到的,導(dǎo)致現(xiàn)有聲紋識別評分結(jié)果不穩(wěn)定。
發(fā)明內(nèi)容
為此,需要提供一種聲紋識別相似度評分的方法和裝置,解決現(xiàn)有聲紋識別結(jié)果不穩(wěn)定的問題。
為實現(xiàn)上述目的,發(fā)明人提供了一種聲紋識別相似度評分的方法,包括如下步驟:
在語料庫中的各個對象的語料子集內(nèi)挑選若干音頻數(shù)據(jù)與語料庫中所有的聲音模型進(jìn)行匹配,得到各自的第一聲紋識別得分集合;
獲取聲紋數(shù)據(jù),并將聲紋數(shù)據(jù)與語料庫中所有的聲音模型進(jìn)行匹配,得到第二聲紋識別得分集合;
根據(jù)第二聲紋識別得分集合的高低順序分配對應(yīng)的第一得分系數(shù)集合;
根據(jù)第一聲紋識別得分集合和第二聲紋識別得分集合計算對應(yīng)的第二得分系數(shù)集合;
根據(jù)第一得分系數(shù)集合、第二得分系數(shù)集合和二者對應(yīng)的得分權(quán)重算出最終得分集合;
將最終得分集合中最高得分作為聲紋相似度的得分。
進(jìn)一步地,步驟“根據(jù)第一聲紋識別得分集合和第二聲紋識別得分集合計算對應(yīng)的第二得分系數(shù)集合”包括步驟:
根據(jù)第一聲紋識別得分集合和第二聲紋識別得分集合,計算語料庫中每個對象的聲紋識別得分集合與第二聲紋識別得分集合的相關(guān)性系數(shù),并根據(jù)相關(guān)性系數(shù)的高低順序分配對應(yīng)的第二得分系數(shù)集合。
進(jìn)一步地,所述聲紋數(shù)據(jù)為用戶聲紋數(shù)據(jù),步驟“將聲紋數(shù)據(jù)與語料庫中所有的聲音模型進(jìn)行匹配,得到第二聲紋識別得分集合”后包括如下步驟:
將用戶聲紋數(shù)據(jù)及對應(yīng)的第二聲紋識別得分集合制作為用戶的虛擬名片信息并保存。
進(jìn)一步地,獲取虛擬名片信息,根據(jù)虛擬名片信息得到用戶聲紋數(shù)據(jù)及對應(yīng)的聲紋識別得分集合,將對應(yīng)的聲紋識別得分集合作為第二聲紋識別得分集合。
進(jìn)一步地,步驟“將用戶聲紋數(shù)據(jù)及對應(yīng)的第二聲紋識別得分集合制作為用戶的虛擬名片信息并保存”包括步驟:
將用戶聲紋數(shù)據(jù)及對應(yīng)的第二聲紋識別得分集合經(jīng)過壓縮或者加密后轉(zhuǎn)化為用戶虛擬名片字符串信息或者虛擬名片二維碼信息。
進(jìn)一步地,還包括如下步驟:
將最終得分集合中最高得分對應(yīng)的聲音模型作為聲紋數(shù)據(jù)最匹配的聲音模型,根據(jù)最匹配的聲音模型推薦歌曲或者歌曲演唱者。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于福建星網(wǎng)視易信息系統(tǒng)有限公司,未經(jīng)福建星網(wǎng)視易信息系統(tǒng)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201511016012.4/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。