[發明專利]用于訓練說話人識別模型的方法、裝置、電子設備和可讀存儲介質在審
| 申請號: | 202110656988.7 | 申請日: | 2021-06-11 |
| 公開(公告)號: | CN113393848A | 公開(公告)日: | 2021-09-14 |
| 發明(設計)人: | 江民 | 申請(專利權)人: | 上海明略人工智能(集團)有限公司 |
| 主分類號: | G10L17/04 | 分類號: | G10L17/04 |
| 代理公司: | 北京康盛知識產權代理有限公司 11331 | 代理人: | 陶俊潔 |
| 地址: | 200000 上海市徐匯區*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 訓練 說話 識別 模型 方法 裝置 電子設備 可讀 存儲 介質 | ||
本申請涉及語音識別技術領域,公開一種用于訓練說話人識別模型的方法,包括:獲取待分類語料;將待分類語料輸入預設的分類模型,確定待分類語料是否屬于垂直領域;在待分類語料屬于垂直領域的情況下,利用待分類語料訓練第一說話人識別模型。通過將獲取到的待分類語料輸入分類模型進行分類,利用屬于垂直領域的待分類語料訓練說話人識別模型,從而提高了垂直領域相關的說話人識別模型的準確率,進而能夠滿足針對垂直領域的說話人識別要求。本申請還公開一種用于訓練說話人識別模型的裝置、電子設備和可讀存儲介質。
技術領域
本申請涉及語音識別技術領域,例如涉及一種用于訓練說話人識別模型的方法、裝置、電子設備和可讀存儲介質。
背景技術
目前,隨著智能客服系統、智能家居系統、智能教學機器人等等的普及,語言模型越來越多應用到生活的方方面面,例如語言模型中的說話人識別模型用于確認語料數據是否是同一個人說的。而在一些特殊的垂直領域——例如銀行、保險等領域有著專業、特有的表達方式,其語義表達之間差異性較小。現有技術通常采用生成式方法獲取用于訓練這些語言模型的垂直領域相關語料,即根據該垂直領域相關的業務目標預設若干有序語義表達式,將每個有序語義表達式進行分詞獲得分詞結果,根據分詞結果在預設詞庫中查找同義詞,再通過分詞結果和同義詞對有序語義表達式進行處理獲得用于訓練說話人識別模型的垂直領域相關語料。這些語料訓練出的說話人識別模型的準確率較低,無法滿足針對垂直領域的說話人識別要求。
發明內容
為了對披露的實施例的一些方面有基本的理解,下面給出了簡單的概括。所述概括不是泛泛評述,也不是要確定關鍵/重要組成元素或描繪這些實施例的保護范圍,而是作為后面的詳細說明的序言。
本公開實施例提供了一種用于訓練說話人識別模型的方法、裝置、電子設備和可讀存儲介質,以提高垂直領域相關的說話人識別模型的準確率。
在一些實施例中,用于訓練說話人識別模型的方法,包括:獲取待分類語料;將所述待分類語料輸入預設的分類模型,確定所述待分類語料是否屬于垂直領域;在所述待分類語料屬于垂直領域的情況下,利用所述待分類語料訓練第一說話人識別模型。
在一些實施例中,用于訓練說話人識別模型的裝置,包括:獲取模塊,被配置為獲取待分類語料;分類模塊,被配置為將所述待分類語料輸入預設的分類模型,確定所述待分類語料是否屬于垂直領域;訓練模塊,被配置為在所述待分類語料屬于垂直領域的情況下,利用所述待分類語料訓練第一說話人識別模型。
在一些實施例中,電子設備包括:處理器和存儲有程序指令的存儲器,所述處理器被配置為在運行所述程序指令時,執行如上述用于訓練說話人識別模型的方法。
在一些實施例中,可讀存儲介質存儲有可執行指令,所述可執行指令在運行時執行上述用于訓練說話人識別模型的方法。
本公開實施例提供的用于訓練說話人識別模型的方法、裝置、電子設備和可讀存儲介質,可以實現以下技術效果:能夠將獲取到的待分類語料輸入預設的分類模型,確定待分類語料是否屬于垂直領域,在待分類語料屬于垂直領域的情況下,利用待分類語料訓練第一說話人識別模型。通過將獲取到的待分類語料輸入分類模型進行分類,利用屬于垂直領域的待分類語料訓練說話人識別模型,從而提高了垂直領域相關的說話人識別模型的準確率,進而能夠滿足針對垂直領域的說話人識別要求。
以上的總體描述和下文中的描述僅是示例性和解釋性的,不用于限制本申請。
附圖說明
一個或多個實施例通過與之對應的附圖進行示例性說明,這些示例性說明和附圖并不構成對實施例的限定,附圖中具有相同參考數字標號的元件示為類似的元件,附圖不構成比例限制,并且其中:
圖1是本公開實施例提供的一個用于訓練說話人識別模型的方法的示意圖;
圖2是本公開實施例提供的一個用于訓練說話人識別模型的裝置的示意圖;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海明略人工智能(集團)有限公司,未經上海明略人工智能(集團)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110656988.7/2.html,轉載請聲明來源鉆瓜專利網。





