[發明專利]說話人分離算法的評估方法、裝置、電子設備和存儲介質有效
| 申請號: | 202110778868.4 | 申請日: | 2021-07-09 |
| 公開(公告)號: | CN113593529B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 苗天時;楊晶生 | 申請(專利權)人: | 北京字跳網絡技術有限公司 |
| 主分類號: | G10L15/04 | 分類號: | G10L15/04;G10L15/26 |
| 代理公司: | 北京植德律師事務所 11780 | 代理人: | 唐華東 |
| 地址: | 100190 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 說話 分離 算法 評估 方法 裝置 電子設備 存儲 介質 | ||
1.一種說話人分離算法的評估方法,包括:
將樣本音頻的說話人分離結果與所述樣本音頻的預設語音分段結果對齊,得到第一對齊結果,其中,所述說話人分離結果通過待評估的說話人分離算法得到,所述第一對齊結果中語音段落的劃分方式與所述預設語音分段結果一致,所述第一對齊結果中的說話人標簽根據所述說話人分離結果中的預測說話人標簽確定;
根據所述第一對齊結果,評估所述待評估的說話人分離算法的覆蓋效果,其中,所述待評估的說話人分離算法的覆蓋效果為所述待評估的說話人分離算法輸出的所述說話人分離結果覆蓋所述樣本音頻的范圍大小。
2.根據權利要求1所述的方法,其中,所述方法還包括:
將所述樣本音頻的真實說話人信息與所述樣本音頻的預設語音分段結果對齊,得到第二對齊結果,其中,所述第二對齊結果中語音段落的劃分方式與所述預設語音分段結果一致,所述第二對齊結果中的說話人標簽根據所述真實說話人信息中的真實說話人標簽確定;
根據所述第一對齊結果和所述第二對齊結果,評估所述待評估的說話人分離算法的預測效果;
其中,所述根據所述第一對齊結果和所述第二對齊結果,評估所述待評估的說話人分離算法的預測效果,包括:
根據所述第二對齊結果中的說話人標簽和所述第一對齊結果中的說話人標簽,確定所述第一對齊結果對應的正確預測時長;
根據所述第一對齊結果對應的所述預測時長和所述正確預測時長,得到所述待評估的說話人分離算法的精確度,評估所述待評估的說話人分離算法的預測效果。
3.根據權利要求2所述的方法,其中,所述方法還包括:
根據所述第二對齊結果,評估所述預設語音分段結果對應的分段算法的分段效果。
4.根據權利要求1所述的方法,其中,所述根據所述第一對齊結果,評估所述待評估的說話人分離算法的覆蓋效果,包括:
根據所述第一對齊結果中每個說話人標簽對應的語音段落的段落時長確定所述第一對齊結果對應的預測時長,以及根據所述第一對齊結果中每個語音段落的段落時長確定所述第一對齊結果對應的總時長;
根據所述第一對齊結果對應的所述預測時長和所述總時長,得到所述待評估的說話人分離算法的覆蓋率,以衡量所述待評估的說話人分離算法的覆蓋效果。
5.根據權利要求3所述的方法,其中,所述根據所述第二對齊結果,評估所述預設語音分段結果對應的分段算法的分段效果,包括:
對于所述第二對齊結果中每個語音段落,根據該語音段落在所述第二對齊結果中的說話人標簽和該語音段落對應的所述真實說話人標簽,確定該語音段落的純凈度,其中,該語音段落的純凈度為所述真實說話人標簽的時間長度與該語音段落的時間長度的比值;
根據所述第二對齊結果中每個語音段落的純凈度,得到所述第二對齊結果的純凈度,以衡量所述預設語音分段結果對應的分段算法的分段效果。
6.根據權利要求2所述的方法,其中,對于所述第二對齊結果中的每個語音段落,該語音段落的說話人標簽通過以下方式確定:
根據所述樣本音頻的真實說話人信息,確定與該語音段落對應的至少一個候選語音段落;
將所述候選語音段落中段落時長最長的語音段落確定為目標語音段落;
根據所述目標語音段落對應的說話人標簽,得到該語音段落的說話人標簽。
7.根據權利要求1-6中任一項所述的方法,其中,所述樣本音頻通過以下方式得到:
獲取預設音頻和所述預設音頻對應的來源設備信息;
根據所述來源設備信息,確定所述預設音頻對應的語音段落和相應的真實說話人標簽,以得到所述樣本音頻。
8.根據權利要求1-6中任一項所述的方法,其中,所述樣本音頻為線上會議音頻。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字跳網絡技術有限公司,未經北京字跳網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110778868.4/1.html,轉載請聲明來源鉆瓜專利網。





