[發明專利]語音匹配方法、裝置、電子設備及存儲介質在審

申請號：	202010826186.1	申請日：	2020-08-17
公開（公告）號：	CN111968650A	公開（公告）日：	2020-11-20
發明（設計）人：	李晉;褚繁;方昕;余青松;柳林;戴禮榮;胡郁	申請（專利權）人：	科大訊飛股份有限公司
主分類號：	G10L17/00	分類號：	G10L17/00;G10L17/22;G10L21/0272
代理公司：	北京路浩知識產權代理有限公司 11002	代理人：	程琛
地址：	230088 安徽省***	國省代碼：	安徽;34
權利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關鍵詞：	語音匹配方法裝置電子設備存儲介質
鉆瓜網技術展會專利詞庫專利權人專利榜在售專利公布日期熱門專利

【說明書】：

本發明實施例提供一種語音匹配方法、裝置、電子設備及存儲介質，所述方法包括：確定待匹配話單的兩個待匹配號碼；將待匹配話單中的語音數據的聲紋特征分別與兩個待匹配號碼的聲紋特征進行匹配，得到待匹配話單中的語音數據與兩個待匹配號碼的匹配關系；其中，任一待匹配號碼的聲紋特征是對該待匹配號碼的話單集中每一語音數據的聲紋特征進行聚類得到的，該待匹配號碼的話單集包括多個以該待匹配號碼為一端、不同號碼為另一端的話單。本發明實施例提供的方法、裝置、電子設備及存儲介質，保證了語音數據與其對應主被叫號碼的一致性。

技術領域

本發明涉及智能語音技術領域，尤其涉及一種語音匹配方法、裝置、電子設備及存儲介質。

背景技術

目前，智能語音技術逐漸在電信的聲訊信息服務中展開應用，并在迅速地推廣。語音匹配指的是將一條話單包括的兩條語音數據，與該話單的主叫號碼和被叫號碼分別進行匹配，以實現主被叫號碼的語音數據的分離。

現有的語音匹配方法是根據預先約定的規則，將一條話單中兩條語音數據按照主叫號碼和被叫號碼分別存儲。由于數據采集設備和數據接入設備可能出現不可預知的故障，部分語音數據的存儲順序與預先約定的規則不符，造成在主叫號碼下可能存儲被叫號碼的說話人的語音數據，或者在被叫號碼下可能存儲主叫號碼的說話人的語音數據，導致部分語音數據的存儲位置顛倒，無法保證語音數據與其對應主被叫號碼的一致性。

發明內容

本發明實施例提供一種語音匹配方法、裝置、電子設備及存儲介質，用以解決現有技術中語音數據與其對應主被叫號碼不一致的缺陷。

本發明實施例提供一種語音匹配方法，包括：

確定待匹配話單的兩個待匹配號碼；

將所述待匹配話單中的語音數據的聲紋特征分別與所述兩個待匹配號碼的聲紋特征進行匹配，得到所述待匹配話單中的語音數據與所述兩個待匹配號碼的匹配關系；

其中，任一待匹配號碼的聲紋特征是對所述任一待匹配號碼的話單集中每一語音數據的聲紋特征進行聚類得到的，所述任一待匹配號碼的話單集包括多個以所述任一待匹配號碼為一端、不同號碼為另一端的話單。

根據本發明一個實施例的語音匹配方法，所述任一待匹配號碼的話單集是基于如下步驟確定的：

基于以所述任一待匹配號碼為一端的所有話單，或，基于以所述任一待匹配號碼為一端且通話時長大于預設時長的所有話單，構建所述任一待匹配號碼的候選話單集；

從所述候選話單集中選取多個另一端為不同號碼的話單，構建所述任一待匹配號碼的話單集。

根據本發明一個實施例的語音匹配方法，所述從所述候選話單集中選取多個另一端為不同號碼的話單，構建所述任一待匹配號碼的話單集，具體包括：

選取所述候選話單集中預設數量個產生時間距離所述待匹配話單的產生時間最近且另一端為不同號碼的話單，構建所述任一待匹配號碼的話單集。

根據本發明一個實施例的語音匹配方法，所述任一待匹配號碼的聲紋特征是基于如下步驟確定的：