[發明專利]聲紋識別系統、方法、裝置及電子設備有效
| 申請號: | 201910060740.7 | 申請日: | 2019-01-21 |
| 公開(公告)號: | CN111462760B | 公開(公告)日: | 2023-09-26 |
| 發明(設計)人: | 鄭斯奇;索宏彬;雷赟 | 申請(專利權)人: | 阿里巴巴集團控股有限公司 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04;G10L17/06 |
| 代理公司: | 北京君以信知識產權代理有限公司 11789 | 代理人: | 譚鎮 |
| 地址: | 英屬開曼群島大開*** | 國省代碼: | 暫無信息 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聲紋 識別 系統 方法 裝置 電子設備 | ||
本申請公開了聲紋識別方法和裝置,聲紋識別系統、方法和裝置,以及,音箱和服務器。其中,聲紋識別方法包括:獲取已標注說話者信息的第一聲紋數據集和未標注說話者信息的第二聲紋數據集,從所述第一聲紋數據集中學習得到第一聲紋識別模型,至少通過第一聲紋識別模型和第二聲紋數據集訓練得到第二聲紋識別模型,至少基于所述第二聲紋識別模型識別聲紋數據。采用這種處理方式,使得利用非監督訓練方式自動對聲紋數據進行說話者信息的標注,避免人工方式標注數據;因此,可以有效提升數據標注的效率及準確度,從而提升聲紋識別的準確度,同時可以有效降低人工成本。
技術領域
本申請涉及聲紋識別技術領域,具體涉及聲紋識別方法和裝置,聲紋識別系統、方法和裝置,以及,音箱和服務器。
背景技術
聲紋識別,屬于生物識別技術的一種,也稱為說話人識別。聲紋識別就是把聲信號轉換成電信號,再用計算機通過聲紋識別模型根據說話者的聲學特征識別出說話者的身份。
一種典型的聲紋識別方法是,通過機器學習的方式從訓練數據中學習得到聲紋識別模型,再基于聲紋識別模型識別聲紋數據。其中,訓練數據包括聲紋數據和標注好的說話者信息。目前,對于聲紋數據的標注方式主要為人工標注方式,即:利用人工逐條對訓練數據集中的每條聲紋數據的說話者進行標注。
然而,在實現本發明過程中,發明人發現現有方案至少存在如下問題:由于需要大量人力和時間對訓練數據的說話者信息進行標注,從而導致數據標注效率低,且人工成本高。此外,數據標注的準確率與標注人的經驗有關,因而數據標注的準確率也無法保證。
發明內容
本申請提供聲紋識別方法,以解決現有技術存在的數據標注準確度及效率低、且人工成本高的問題。本申請另外提供聲紋識別裝置,聲紋識別系統、方法和裝置,以及,音箱和服務器。
本申請提供一種聲紋識別方法,包括:
獲取已標注說話者信息的第一聲紋數據集和未標注說話者信息的第二聲紋數據集;
從所述第一聲紋數據集中學習得到第一聲紋識別模型;
至少通過第一聲紋識別模型和第二聲紋數據集訓練得到第二聲紋識別模型;
至少基于所述第二聲紋識別模型識別聲紋數據。
可選的,所述至少通過第一聲紋識別模型和第二聲紋數據集訓練得到第二聲紋識別模型,包括:
通過所述第一聲紋識別模型,識別所述第二聲紋數據的說話者信息;
從所述第一聲紋數據集和由所述第二聲紋數據的說話者信息標注的第二聲紋數據集中,學習得到第二聲紋識別模型。
可選的,所述通過所述第一聲紋識別模型,并識別所述第二聲紋數據的說話者信息,包括:
將所述第二聲紋數據集劃分為多個第二聲紋數據子集;
遍歷所述多個第二聲紋數據子集,針對各個所述第二聲紋數據子集執行如下步驟:
通過所述第一聲紋識別模型,識別所述第二聲紋數據子集包括的第二聲紋數據的說話者信息;
根據訓練所述第一聲紋識別模型依據的聲紋數據集、及由所述第二聲紋數據的說話者信息標注的第二聲紋數據子集,更新所述第一聲紋識別模型。
可選的,所述第一聲紋數據和所述第二聲紋數據包括喚醒詞聲紋數據;
所述方法還包括:
獲取未標注說話者信息的第三聲紋數據集;所述第三聲紋數據集包括喚醒詞以外內容的聲紋數據;
所述至少通過第一聲紋識別模型和第二聲紋數據集訓練得到第二聲紋識別模型,還包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于阿里巴巴集團控股有限公司,未經阿里巴巴集團控股有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910060740.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種播放器的控制電路和播放器
- 下一篇:由用戶設備執行的切換方法以及用戶設備





