[發明專利]一種基于網絡融合的聲紋識別方法及裝置有效
| 申請號: | 201810456054.7 | 申請日: | 2018-05-14 |
| 公開(公告)號: | CN110299142B | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 蔡曉東;李波 | 申請(專利權)人: | 桂林遠望智能通信科技有限公司 |
| 主分類號: | G10L17/18 | 分類號: | G10L17/18;G10L17/06 |
| 代理公司: | 北京慕達星云知識產權代理事務所(特殊普通合伙) 11465 | 代理人: | 姜海榮 |
| 地址: | 541001 廣西壯族自治區桂林市七星*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 網絡 融合 聲紋 識別 方法 裝置 | ||
本發明公開了基于網絡融合的聲紋識別方法及裝置,包括:將待識別聲紋音頻的語音樣本轉換為第一語譜圖,將與所述待識別聲紋音頻進行比對的聲紋數據庫中的語音樣本轉換為第二語譜圖;將第一語譜圖和第二語譜圖輸入時序相關卷積神經網絡聲紋識別模型,分別提取聲紋特征;在所述時序相關卷積神經網絡聲紋識別模型中引入CSR模型;將待識別聲紋音頻的聲紋特征與所述聲紋數據庫中的聲紋特征進行比對,根據引入CSR模型提供的獎懲函數,確定識別結果。本發明采用時序相關卷積神經網絡,引入CSR模型,可以解決GMM?HMM方法對大規模語音數據建模不是很好的問題,并且能夠對抗一定噪聲,與傳統的聲紋識別方法相比,能夠提高聲紋識別的識別率。
技術領域
本發明涉及聲紋識別技術領域,特別涉及一種基于網絡融合的聲紋識別方法及裝置。
背景技術
聲紋識別,是從一段語音中提取分析和提取出說話人的個性特征,自動確定說話人的過程。聲紋識別技術作為一種典型的聲紋特征識別技術,以其便捷、安全可靠等特點,在安防領域、公安司法領域、軍事領域及醫學領域都有廣泛的應用前景。
聲紋識別技術,又稱為說話人識別技術,是一種生物識別的技術。說話人識別包括說話人確認技術和說話人辨認技術,說話人確認是指判斷一段話是否為某人所說,為“一對一”問題;說話人辨認是指在n個已知樣本中選擇一個與未知音頻樣本最像的一個音頻,是“多選一”問題。
聲紋識別技術又發分為文本相關和文本無關兩類,與文本有關的聲紋識別系統要求用戶按照規定的內容發音,每個人的聲紋模型逐個被精確地建立,而識別時也必須按規定的內容發音,因此可以達到較好的識別效果,但系統需要用戶配合,如果用戶的發音與規定的內容不符合,則無法正確識別該用戶。而與文本無關的識別系統則不規定說話人的發音內容,模型建立相對困難,但用戶使用方便,可應用范圍較寬。根據特定的任務和應用,兩種是有不同的應用范圍的。比如,在銀行交易時可以使用文本相關的聲紋識別,因為用戶自己進行交易時是愿意配合的;而在刑偵或偵聽應用中則無法使用文本相關的聲紋識別,因為你無法要求犯罪嫌疑人或被偵聽的人配合。
在對說話的人辨認方面,根據待識別的說話人是否在注冊的說話人集合內,說話人辨認可以分為開集(open-set)辨認和閉集(close-set)辨認。前者假定待識別說話人可以在集合外,而后者假定待識別說話人在集合內。顯然,開集辨認需要有一個對集外說話人的“拒識問題”,而且閉集辨認的結果要好于開集辨認結果。本質上講,說話人確認和開集說話人辨認都需要用到拒識技術,為了達到很好的拒識效果,通常需要訓練一個假冒者模型或背景模型,以便拒識時有可資比較的對象,閾值容易選定。而建立背景模型的好壞直接影響到拒識甚至聲紋識別的性能。另外現有的GMM-HMM模型用于語音識別,對大規模語音數據建模處理的不是很好。
傳統說話人識別技術采用GMM-UBM通用背景模型,首先利用大量說話人的語音數據訓練一個說話人無關的通用背景模型,然后利用可獲得的少量當前說話人的語音數據,通過最大后驗概率或者最大似然回歸準則,訓練得到說話人模型。
傳統方法中,分別針對待識別語音數據計算說話人對應的GMM和UBM模型似然度,并通過對數似然比這個度量來計算最后的得分,但其識別的準確率較低。如何提高聲紋識別率一直是同行業技術人員亟待解決的問題。
發明內容
鑒于上述問題,提出了本發明以便提供一種克服上述問題或者至少部分地解決上述問題的基于網絡融合的聲紋識別方法及裝置。
第一方面,本發明實施例提供一種基于網絡融合的聲紋識別方法,包括:
將待識別聲紋音頻的語音樣本轉換為第一語譜圖,將與所述待識別聲紋音頻進行比對的聲紋數據庫中的語音樣本轉換為第二語譜圖;
將所述第一語譜圖和第二語譜圖輸入時序相關卷積神經網絡聲紋識別模型,分別提取聲紋特征;
在所述時序相關卷積神經網絡聲紋識別模型中引入CSR模型;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于桂林遠望智能通信科技有限公司,未經桂林遠望智能通信科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810456054.7/2.html,轉載請聲明來源鉆瓜專利網。





