[發明專利]基于人聲分離的客服服務質檢方法、系統、設備及介質在審
| 申請號: | 202011396382.6 | 申請日: | 2020-12-03 |
| 公開(公告)號: | CN112562644A | 公開(公告)日: | 2021-03-26 |
| 發明(設計)人: | 劉露婕;王鳴 | 申請(專利權)人: | 云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司 |
| 主分類號: | G10L15/02 | 分類號: | G10L15/02;G10L15/26;G10L25/60 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100096 北京市海*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 人聲 分離 客服 服務 質檢 方法 系統 設備 介質 | ||
本發明涉及一種基于人聲分離的客服服務質檢方法、系統、設備及介質,該方法包括:采集客服與客戶的通話錄音;采用預先訓練的降噪網絡模型對所述通話錄音進行人聲分離,得到所述通話錄音中客服的第一音頻文件以及最大匹配度;若所述匹配度高于預設閾值,則根據所述第一音頻文件對所述最大匹配度對應的客服的服務進行質檢。本發明能夠對通話錄音進行人聲分離,僅保留需要質檢的客服的聲音,排除了不需要質檢的客戶的聲音,并給出了客服的匹配度以便進一步確認客服的身份,大大降低了質檢人員的工作負擔。
技術領域
本發明涉及聲音識別領域,具體涉及一種基于人聲分離的客服服務質檢方法、系統、設備及介質。
背景技術
在通話場景中,至少有兩人參與對話,在一些業務場景中,有將不同說話人區分并且識別其說話內容,并進一步進行話術分析的需求,但受技術限制,待識別和分離的語音有時會保存在同一個通道中或者在一個嘈雜環境中會同時收到多個人的語音,給進一步從混雜了多個說話人的語音中識別目標說話人的語音并進行話術分析造成困難,也就是所謂的“雞尾酒會問題”。
目前在售樓處及其他電話銷售場景,為保證客服話術的精準和專業,需要對客服的通話錄音進行人工質檢,在人工質檢過程中,由于可能存在錄音文件標記的客服與實際情況不對應的情況,需要質檢人員辨認通話錄音對應的客服,并且,由于通話錄音除包含了需要質檢的客服的聲音之外,還包含了不需要質檢的客戶的聲音,給質檢人員帶來了額外的工作負擔。
發明內容
本發明提供一種基于人聲分離的客服服務質檢方法、系統、設備及介質,能夠解決上述的技術問題。
本發明解決上述技術問題的技術方案如下:
一種基于人聲分離的客服服務質檢方法,包括:
采集客服與客戶的通話錄音;
采用預先訓練的降噪網絡模型對所述通話錄音進行人聲分離,得到所述通話錄音中客服的第一音頻文件以及最大匹配度;
若所述匹配度高于預設閾值,則根據所述第一音頻文件對所述最大匹配度對應的客服的服務進行質檢。
進一步,所述采用預先訓練的降噪網絡模型對所述通話錄音進行人聲分離,得到所述通話錄音中客服的第一音頻文件以及最大匹配度,具體包括:
采用預先訓練的聲紋特征模型提取全體客服的原始音頻中的聲音特征;
將所述聲音特征和所述通話錄音輸入預先訓練的降噪網絡模型,分離得到所述通話錄音中客服的第一音頻文件以及最大匹配度。
上述進一步方案的有益效果是,通過采集聲音特征與通話錄音一并輸入降噪網絡模型,能夠實現對通話錄音中客服聲音的自動提取,并給出識別出的最大匹配度及對應的客服。
進一步,所述根據所述第一音頻文件對所述最大匹配度對應的客服的服務進行質檢,具體包括:
將所述第一音頻文件轉寫成文字并發送至顯示設備進行展示,以便質檢人員根據所述顯示設備展示的文字對所述最大匹配度對應的客服的服務進行質檢。
上述進一步方案的有益效果是,通過將音頻轉換成文字以便于直觀、方便地對客服的服務進行質檢。
進一步,該方法還包括:
若所述最大匹配度低于預設閾值,則對所述第一音頻文件進行人工標注,確定所述第一音頻文件對應的客服。
上述進一步方案的有益效果是,對于匹配度低的音頻文件,通過人工標注的方式來確定其對應的客服。
進一步,該方法還包括:
若所述最大匹配度低于預設閾值,則將所述最大匹配度對應的客服作為推薦結果;
對所述推薦結果是否準確進行人工確認;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司,未經云知聲智能科技股份有限公司;廈門云知芯智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011396382.6/2.html,轉載請聲明來源鉆瓜專利網。





