[發明專利]語音匹配方法、裝置、電子設備及存儲介質在審
| 申請號: | 202010826186.1 | 申請日: | 2020-08-17 |
| 公開(公告)號: | CN111968650A | 公開(公告)日: | 2020-11-20 |
| 發明(設計)人: | 李晉;褚繁;方昕;余青松;柳林;戴禮榮;胡郁 | 申請(專利權)人: | 科大訊飛股份有限公司 |
| 主分類號: | G10L17/00 | 分類號: | G10L17/00;G10L17/22;G10L21/0272 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 程琛 |
| 地址: | 230088 安徽省*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 匹配 方法 裝置 電子設備 存儲 介質 | ||
本發明實施例提供一種語音匹配方法、裝置、電子設備及存儲介質,所述方法包括:確定待匹配話單的兩個待匹配號碼;將待匹配話單中的語音數據的聲紋特征分別與兩個待匹配號碼的聲紋特征進行匹配,得到待匹配話單中的語音數據與兩個待匹配號碼的匹配關系;其中,任一待匹配號碼的聲紋特征是對該待匹配號碼的話單集中每一語音數據的聲紋特征進行聚類得到的,該待匹配號碼的話單集包括多個以該待匹配號碼為一端、不同號碼為另一端的話單。本發明實施例提供的方法、裝置、電子設備及存儲介質,保證了語音數據與其對應主被叫號碼的一致性。
技術領域
本發明涉及智能語音技術領域,尤其涉及一種語音匹配方法、裝置、電子設備及存儲介質。
背景技術
目前,智能語音技術逐漸在電信的聲訊信息服務中展開應用,并在迅速地推廣。語音匹配指的是將一條話單包括的兩條語音數據,與該話單的主叫號碼和被叫號碼分別進行匹配,以實現主被叫號碼的語音數據的分離。
現有的語音匹配方法是根據預先約定的規則,將一條話單中兩條語音數據按照主叫號碼和被叫號碼分別存儲。由于數據采集設備和數據接入設備可能出現不可預知的故障,部分語音數據的存儲順序與預先約定的規則不符,造成在主叫號碼下可能存儲被叫號碼的說話人的語音數據,或者在被叫號碼下可能存儲主叫號碼的說話人的語音數據,導致部分語音數據的存儲位置顛倒,無法保證語音數據與其對應主被叫號碼的一致性。
發明內容
本發明實施例提供一種語音匹配方法、裝置、電子設備及存儲介質,用以解決現有技術中語音數據與其對應主被叫號碼不一致的缺陷。
本發明實施例提供一種語音匹配方法,包括:
確定待匹配話單的兩個待匹配號碼;
將所述待匹配話單中的語音數據的聲紋特征分別與所述兩個待匹配號碼的聲紋特征進行匹配,得到所述待匹配話單中的語音數據與所述兩個待匹配號碼的匹配關系;
其中,任一待匹配號碼的聲紋特征是對所述任一待匹配號碼的話單集中每一語音數據的聲紋特征進行聚類得到的,所述任一待匹配號碼的話單集包括多個以所述任一待匹配號碼為一端、不同號碼為另一端的話單。
根據本發明一個實施例的語音匹配方法,所述任一待匹配號碼的話單集是基于如下步驟確定的:
基于以所述任一待匹配號碼為一端的所有話單,或,基于以所述任一待匹配號碼為一端且通話時長大于預設時長的所有話單,構建所述任一待匹配號碼的候選話單集;
從所述候選話單集中選取多個另一端為不同號碼的話單,構建所述任一待匹配號碼的話單集。
根據本發明一個實施例的語音匹配方法,所述從所述候選話單集中選取多個另一端為不同號碼的話單,構建所述任一待匹配號碼的話單集,具體包括:
選取所述候選話單集中預設數量個產生時間距離所述待匹配話單的產生時間最近且另一端為不同號碼的話單,構建所述任一待匹配號碼的話單集。
根據本發明一個實施例的語音匹配方法,所述任一待匹配號碼的聲紋特征是基于如下步驟確定的:
對所述任一待匹配號碼的話單集中每一語音數據的聲紋特征進行聚類,得到對應所述任一待匹配號碼的聚類結果;
基于對應所述任一待匹配號碼的聚類結果中每個簇的質量參數,確定所述任一待匹配號碼的聲紋特征所屬的簇;
基于所述任一待匹配號碼的聲紋特征所屬的簇,確定所述任一待匹配號碼的聲紋特征。
根據本發明一個實施例的語音匹配方法,所述語音數據的聲紋特征是基于如下步驟確定的:
將所述語音數據輸入至聲紋提取模型,得到所述聲紋提取模型輸出的所述語音數據的聲紋特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于科大訊飛股份有限公司,未經科大訊飛股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010826186.1/2.html,轉載請聲明來源鉆瓜專利網。





