[發明專利]一種識別同一說話人的方法和裝置有效
| 申請號: | 202010545180.7 | 申請日: | 2020-06-16 |
| 公開(公告)號: | CN111508503B | 公開(公告)日: | 2020-10-20 |
| 發明(設計)人: | 張晴晴;賈艷明;張雪璐;岑吳镕 | 申請(專利權)人: | 北京愛數智慧科技有限公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/14;G10L25/51;G10L25/78 |
| 代理公司: | 北京智沃律師事務所 11620 | 代理人: | 吳志宏 |
| 地址: | 100044 北京市海淀區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 識別 同一 說話 方法 裝置 | ||
本發明公開一種識別同一說話人的方法和裝置,該方法包括以下步驟:采集第一音頻和第二音頻,所述第一音頻為第一說話人在第一背景環境下輸出的人聲,所述第二音頻為第二說話人在所述第一背景環境下輸出的人聲;獲取與所述第一背景環境對應的第一閾值;判斷所述第一音頻和所述第二音頻的相似度是否大于所述第一閾值,若是,則確定所述第一說話人和所述第二說話人為同一說話人。本發明針對聲紋識別的環境因素、語種等外部因素,判斷音頻背景環境并進行分類,從而確定閾值,并基于該閾值判斷兩個說話人是否為同一說話人,能夠提升說話人識別的正確率。
技術領域
本發明涉及音頻技術領域,特別涉及一種識別同一說話人的方法和裝置。
背景技術
人類語言的產生,是人體語言中樞與發音器官之間一個復雜的生理物理過程。人在講話時使用的發聲器官(舌、牙齒、喉頭、肺和鼻腔)在尺寸和形態方面,每個人的差異很大,所以,任何兩個人的聲紋圖譜都有差異。所謂聲紋(Voiceprint),是指用電聲學儀器顯示的攜帶言語信息的聲波頻譜。每個人的語音聲學特征既有相對穩定性,又有變異性,不是絕對的、一成不變的。這種變異可來自生理、病理、心理、模擬和偽裝,也與環境干擾有關。盡管如此,由于每個人的發音器官都不盡相同,因此在一般情況下,人們仍能區別不同的人的聲音或判斷是否是同一人的聲音。
作為生物識別技術的一種,聲紋識別也稱為說話人識別,包括說話人辨認和說話人確認。聲紋識別技術將聲音信號轉換成電信號,再用計算機進行識別。不同的任務和應用會使用不同的聲紋識別技術,例如,縮小刑偵范圍時,可能需要說話人辨認技術,而銀行交易時,則需要說話人確認技術。
與其他生物特征相比,聲紋識別的應用仍具有以下優勢:(1)蘊含聲紋特征的語音獲取方便、自然,聲紋提取可在不知不覺中完成,因此使用者的接受程度也高;(2)獲取語音的識別成本低廉,使用簡單,一個麥克風即可,在使用通訊設備時更無需額外的錄音設備;(3)適合遠程身份確認,只需要一個麥克風或電話、手機就可以通過網路(通訊網絡或互聯網絡)實現遠程登錄;(4)聲紋辨認和確認的算法復雜度低;(5)配合一些其他措施,如通過語音識別進行內容鑒別等,可以提高準確率。這些優勢使得聲紋識別的應用越來越受到系統開發者和用戶青睞,聲紋識別的世界市場占有率為15.8%,僅次于基于指紋和掌紋的生物特征識別,并有不斷上升的趨勢。
然而,現有技術中,由于不同背景環境(如車載噪聲,電話信道)以及語種等因素影響,會導致聲紋識別結果不可靠。
發明內容
本發明提供了一種識別同一說話人的方法和裝置,以解決現有技術中聲紋識別結果不可靠的缺陷。
本發明提供了一種識別同一說話人的方法,包括以下步驟:
采集第一音頻和第二音頻,所述第一音頻為第一說話人在第一背景環境下輸出的人聲,所述第二音頻為第二說話人在所述第一背景環境下輸出的人聲;
獲取與所述第一背景環境對應的第一閾值;
判斷所述第一音頻和所述第二音頻的相似度是否大于所述第一閾值,若是,則確定所述第一說話人和所述第二說話人為同一說話人。
可選地,所述獲取與所述第一背景環境對應的第一閾值,包括:
根據所述第一音頻的噪聲類型、說話語種和信噪比,確定與所述第一背景環境對應的第一閾值。
可選地,所述根據所述第一音頻的噪聲類型、說話語種和信噪比,確定與所述第一背景環境對應的第一閾值,包括:
獲取與所述第一音頻的噪聲類型對應的第一噪聲閾值、與所述第一音頻的說話語種對應的第一語種閾值,以及與所述第一音頻的信噪比對應的第一信噪比閾值;
根據所述第一噪聲閾值、第一語種閾值和所述第一信噪比閾值,確定所述第一閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京愛數智慧科技有限公司,未經北京愛數智慧科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010545180.7/2.html,轉載請聲明來源鉆瓜專利網。





