[發明專利]一種語音質檢方法及裝置有效
| 申請號: | 201811247877.5 | 申請日: | 2018-10-25 |
| 公開(公告)號: | CN109446524B | 公開(公告)日: | 2019-10-11 |
| 發明(設計)人: | 楊俊;陳立 | 申請(專利權)人: | 第四范式(北京)技術有限公司 |
| 主分類號: | G06F17/27 | 分類號: | G06F17/27;G06F16/35;G06Q10/06;H04M3/51;G10L15/26 |
| 代理公司: | 北京銘碩知識產權代理有限公司 11286 | 代理人: | 曾世驍;蘇銀虹 |
| 地址: | 100085 北京市海淀區上*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 質檢 條目 語音 檢測 文本 機器學習模型 語音數據內容 規則確定 匹配結果 條目集合 語音檢測 語音轉換 全面性 匹配 | ||
本發明公開了一種語音質檢方法及裝置,涉及語音檢測技術領域,主要目的在于提高語音質檢的全面性與準確性。本發明主要的技術方案為:將待質檢語音轉換為待質檢文本;從質檢條目集合中逐一提取質檢條目,所述質檢條目用于檢測所述待質檢文本是否符合要求;利用預先訓練好的機器學習模型檢測所述待質檢文本中是否含有與所述質檢條目相匹配的內容;根據匹配結果和所述質檢條目對應的檢測規則確定所述待質檢語音是否合格。本發明用于對語音數據內容的規范性檢測。
技術領域
本發明涉及語音檢測技術領域,尤其涉及一種語音質檢方法及裝置。
背景技術
客服語音質檢是為了促進企業營銷、市場開拓,提高客戶滿意度、完善客戶服務,同時對客服人員工作進行考評。呼叫中心每天都會產生龐大的電話錄音,通過對這些錄音進行質檢,檢測客服人員是否使用規范用語、是否服務到位,滿足客戶所需。
傳統的語音質檢工作是由質檢人員進行人工檢測的,這種方式在面對大量語音數據時,不僅需要耗費大量的人力,并且由于檢測人員的質檢尺度不同,也會導致質檢質量的不穩定。而為了避免該情況,目前一般采用兩種質檢方式,一種是利用概率統計學進行人工的抽樣質檢,但該方式在確定抽樣概率時,需要依據歷史錄音質量的統計值確定,若歷史數據缺失或精度較低,將會直接影響質檢結果的準確性。另一種是利用規則或匹配算法對語音數據進行機器識別并打分,此種方式可以實現對所有語音數據的逐條質檢,但這種方式所使用的規則較為固定、死板,針對語音中存在的近似語義表述很難有效匹配。可見,目前在針對語音質檢領域中,還缺少一種既能夠保證對語音數據的全覆蓋質檢,又能夠準確檢測出語音數據中的語義信息是否合格的質檢方案。
發明內容
鑒于上述問題,本發明提出了一種語音質檢方法及裝置,主要目的在于提高語音質檢的全面性與準確性。
為達到上述目的,本發明主要提供如下技術方案:
一方面,本發明提供一種語音質檢方法,具體包括:
將待質檢語音轉換為待質檢文本;
從質檢條目集合中逐一提取質檢條目,所述質檢條目用于檢測所述待質檢文本是否符合要求;
利用預先訓練好的機器學習模型檢測所述待質檢文本中是否含有與所述質檢條目相匹配的內容;
根據匹配結果和所述質檢條目對應的檢測規則確定所述待質檢語音是否合格。
優選的,所述檢測規則包括:
若待質檢文本中包含與質檢條目相匹配的內容,對應的待質檢語音符合要求,反之,對應的待質檢語音不符合要求;
或者,
若待質檢文本中包含與質檢條目相匹配的內容,對應的待質檢語音不符合要求,反之,對應的待質檢語音符合要求。
優選的,從質檢條目集合中逐一提取質檢條目之后,所述方法還包括:
確定所提取的一條質檢條目中的質檢信息類型,所述一條質檢條目中的質檢信息類型為短語或句子;
根據所述質檢信息類型選擇對應的機器學習模型。
優選的,當質檢信息類型為短語時,所述利用預先訓練好的機器學習模型檢測所述待質檢文本中是否含有與所述質檢條目相匹配的內容包括:
確定所述質檢條目中含有短語的共現詞;
利用所述共現詞在所述待質檢文本中確定待檢測段落;
利用機器學習模型檢測所述待檢測段落中是否含有與所述質檢條目中的短語相匹配的內容。
優選的,利用所述共現詞在所述待質檢文本中確定待檢測段落包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于第四范式(北京)技術有限公司,未經第四范式(北京)技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811247877.5/2.html,轉載請聲明來源鉆瓜專利網。





