[發(fā)明專(zhuān)利]一種基于多人說(shuō)話的聲紋識(shí)別方法在審
| 申請(qǐng)?zhí)枺?/td> | 201610024134.6 | 申請(qǐng)日: | 2016-01-14 |
| 公開(kāi)(公告)號(hào): | CN106971737A | 公開(kāi)(公告)日: | 2017-07-21 |
| 發(fā)明(設(shè)計(jì))人: | 祝銘明 | 申請(qǐng)(專(zhuān)利權(quán))人: | 芋頭科技(杭州)有限公司 |
| 主分類(lèi)號(hào): | G10L17/08 | 分類(lèi)號(hào): | G10L17/08;G10L17/14 |
| 代理公司: | 上海申新律師事務(wù)所31272 | 代理人: | 黨蕾 |
| 地址: | 310000 浙江省杭州市余杭區(qū)*** | 國(guó)省代碼: | 浙江;33 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 說(shuō)話 聲紋 識(shí)別 方法 | ||
1.一種基于多人說(shuō)話的聲紋識(shí)別方法,其特征在于:預(yù)設(shè)一第一頻段以及一第二頻段,所述第一頻段高于所述第二頻段,包括下述步驟:
步驟S1,接收多個(gè)說(shuō)話人的聲源;
步驟S2,對(duì)所述聲源進(jìn)行分解,以分別獲取每個(gè)人的語(yǔ)音;
步驟S3,將每個(gè)人的所述語(yǔ)音均與所述第一頻段進(jìn)行匹配,以獲取相應(yīng)的匹配關(guān)聯(lián)度,或者
將每個(gè)人的所述語(yǔ)音均與所述第二頻段進(jìn)行匹配,以獲取相應(yīng)的匹配關(guān)聯(lián)度;
步驟S4,提取最大的所述匹配關(guān)聯(lián)度對(duì)應(yīng)的所述語(yǔ)音,將所述語(yǔ)音與所述第一頻段或者所述第二頻段進(jìn)行擬合;
步驟S5,將分別處于所述第一頻段或者所述第二頻段下的不同背景、不同人聲的語(yǔ)音分割為特定長(zhǎng)度的識(shí)別區(qū)段;
步驟S6,對(duì)每個(gè)所述識(shí)別區(qū)段做特征變換后得到相應(yīng)的多個(gè)識(shí)別特征,并采用關(guān)聯(lián)于所有所述識(shí)別區(qū)段的所有所述識(shí)別特征分別構(gòu)成對(duì)應(yīng)所述第一頻段的識(shí)別特征空間,或者對(duì)應(yīng)所述第二頻段的所述識(shí)別特征空間;
步驟S7,將所述識(shí)別特征空間劃分成復(fù)數(shù)個(gè)子空間,并以描述信息每個(gè)被劃分的所述子空間,以及分別對(duì)每個(gè)所述子空間賦予一對(duì)應(yīng)的序號(hào);
步驟S8,分別將處于所述第一頻段或者處于所述第二頻段的關(guān)聯(lián)于訓(xùn)練模型的每條訓(xùn)練語(yǔ)句做特征變換后得到包括相應(yīng)的時(shí)序特征點(diǎn)的時(shí)序特征點(diǎn)集,每個(gè)所述時(shí)序特征點(diǎn)分別被分配入同頻段下的各個(gè)所述子空間,根據(jù)每個(gè)所述時(shí)序特征點(diǎn)對(duì)應(yīng)的所述子空間的序號(hào)分別形成關(guān)聯(lián)于所述第一頻段或者所述第二頻段的第一序列,并進(jìn)而形成對(duì)應(yīng)的訓(xùn)練識(shí)別特征;
步驟S9,分別將處于所述第一頻段或者處于所述第二頻段的關(guān)聯(lián)于測(cè)試模型的每條測(cè)試語(yǔ)句做特征變換后得到所述時(shí)序特征點(diǎn)集,每個(gè)所述時(shí)序特征點(diǎn)分別被分配入各個(gè)所述子空間,根據(jù)每個(gè)所述時(shí)序特征點(diǎn)對(duì)應(yīng)的所述子空間的序號(hào)分別形成關(guān)聯(lián)于所述第一頻段或者所述第二頻段的第二序列,并進(jìn)而形成對(duì)應(yīng)的測(cè)試識(shí)別特征;
步驟S10,對(duì)比關(guān)聯(lián)于所述第一頻段的所述訓(xùn)練識(shí)別特征與所述測(cè)試識(shí)別 特征是否相似,并根據(jù)對(duì)比結(jié)果處理得到基于多人說(shuō)話的聲紋識(shí)別的確認(rèn)結(jié)果,或者
對(duì)于關(guān)聯(lián)于所述第二頻段的所述訓(xùn)練識(shí)別特征與所述測(cè)試識(shí)別特征是否相似,并根據(jù)對(duì)比結(jié)果處理得到基于多人說(shuō)話的聲紋識(shí)別的確認(rèn)結(jié)果。
2.如權(quán)利要求1所述的基于多人說(shuō)話的聲紋識(shí)別方法,其特征在于,所述步驟S8中,每個(gè)所述時(shí)序特征點(diǎn)按照最近鄰原則被分配入各個(gè)所述子空間內(nèi)。
3.如權(quán)利要求1所述的基于多人說(shuō)話的聲紋識(shí)別方法,其特征在于,所述步驟S8中,將被分配入所述時(shí)序特征點(diǎn)的各個(gè)所述子空間按照所述序號(hào)組成一空間序列,并將所述空間序列作為所述第一序列,以形成所述訓(xùn)練識(shí)別特征。
4.如權(quán)利要求1所述的基于多人說(shuō)話的聲紋識(shí)別方法,其特征在于,所述步驟S9中,將被分配入所述時(shí)序特征點(diǎn)的各個(gè)所述子空間按照所述序號(hào)組成一空間序列,并將所述控件序列作為所述第二序列,以形成所述測(cè)試識(shí)別特征。
5.如權(quán)利要求3所述的基于多人說(shuō)話的聲紋識(shí)別方法,其特征在于,所述步驟S8中,所述空間序列中包括關(guān)聯(lián)于每個(gè)所述子空間的數(shù)據(jù)組,一個(gè)所述數(shù)據(jù)組對(duì)應(yīng)一個(gè)所述序號(hào);
在形成所述空間序列后,還包括分別對(duì)處于所述第一頻段或者所述第二頻段的所述空間序列進(jìn)行的第一數(shù)據(jù)壓縮的過(guò)程,具體為:
步驟S81,記錄每個(gè)所述數(shù)據(jù)組的所述序號(hào),并記錄關(guān)聯(lián)于每個(gè)所述序號(hào)的重復(fù)序號(hào)數(shù)量;
步驟S82,判斷是否存在所述序號(hào)的所述重復(fù)序號(hào)數(shù)量為1,并在存在所述重復(fù)序號(hào)數(shù)量為1的所述數(shù)據(jù)組時(shí)轉(zhuǎn)向步驟S83;
步驟S83,刪除所述重復(fù)序號(hào)數(shù)量為1的所述序號(hào)對(duì)應(yīng)的所述數(shù)據(jù)組;
步驟S84,判斷被刪除的所述數(shù)據(jù)組的前一個(gè)數(shù)據(jù)組的所述序號(hào)是否與被刪除的所述數(shù)據(jù)組的后一個(gè)數(shù)據(jù)組的所述序號(hào)相同:
若相同,則將所述前一個(gè)數(shù)據(jù)組和所述后一個(gè)數(shù)據(jù)組合并;
若不相同,則保留所述前一個(gè)數(shù)據(jù)組和所述后一個(gè)數(shù)據(jù)組;
對(duì)所述空間序列中的所有所述數(shù)據(jù)組均執(zhí)行所述第一數(shù)據(jù)壓縮后形成所 述第一序列。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于芋頭科技(杭州)有限公司,未經(jīng)芋頭科技(杭州)有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610024134.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
- 基于事先知識(shí)的說(shuō)話者檢驗(yàn)及說(shuō)話者識(shí)別系統(tǒng)和方法
- 說(shuō)話人聲音的后臺(tái)學(xué)習(xí)
- 基于模型順序自適應(yīng)技術(shù)的說(shuō)話人確認(rèn)系統(tǒng)創(chuàng)建方法
- 語(yǔ)音合成字典生成裝置和語(yǔ)音合成字典生成方法
- 說(shuō)話人識(shí)別方法和說(shuō)話人識(shí)別設(shè)備
- 語(yǔ)音處理的方法、裝置、系統(tǒng)、設(shè)備和介質(zhì)
- 一種基于多說(shuō)話人條件下目標(biāo)說(shuō)話人語(yǔ)音提取方法
- 一種語(yǔ)音處理方法、介質(zhì)及系統(tǒng)
- 語(yǔ)音翻譯裝置、語(yǔ)音翻譯方法以及記錄介質(zhì)
- 說(shuō)話人識(shí)別方法、相關(guān)設(shè)備及可讀存儲(chǔ)介質(zhì)
- 一種快速識(shí)別聲紋方法和系統(tǒng)
- 聲紋遙控器
- 一種自學(xué)習(xí)聲紋識(shí)別的更新方法和裝置
- 基于聲紋信息的身份認(rèn)證及識(shí)別方法
- 一種聲紋數(shù)據(jù)庫(kù)建立方法、聲紋識(shí)別方法、裝置及系統(tǒng)
- 聲紋信息的比對(duì)方法及裝置、儲(chǔ)存介質(zhì)、電子裝置
- 聲紋認(rèn)證方法、裝置、計(jì)算機(jī)設(shè)備以及存儲(chǔ)介質(zhì)
- 一種處理方法及電子設(shè)備
- 聲紋相似度智能識(shí)別系統(tǒng)、方法及存儲(chǔ)介質(zhì)
- 碰撞檢測(cè)方法、機(jī)器人、移動(dòng)終端及存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 車(chē)載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





