[發明專利]客服語音識別方法、裝置、服務器及存儲介質有效
| 申請號: | 202010699013.8 | 申請日: | 2020-07-20 |
| 公開(公告)號: | CN111883133B | 公開(公告)日: | 2023-08-29 |
| 發明(設計)人: | 顧曉雪;謝翀 | 申請(專利權)人: | 深圳樂信軟件技術有限公司 |
| 主分類號: | G10L15/26 | 分類號: | G10L15/26;G10L15/04;G10L15/05;G10L15/16;G10L15/18;G10L17/00;G10L17/26 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 潘登 |
| 地址: | 518000 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 客服 語音 識別 方法 裝置 服務器 存儲 介質 | ||
本發明實施例公開了一種客服語音識別方法、裝置、服務器及存儲介質,所述方法包括:對待識別音頻數據進行端點檢測,以獲取多個單句音頻數據;通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據,所述預設聲學模型基于客服語音數據構建;通過預設語言模型確定所述多個第一文本數據對應的多個第二文本數據,所述預設語言模型基于線上客服文本數據構建。本發明實施例通過將基于客服語音數據構建的預設聲學模型與基于線上客服文本數據構建的語言模型相結合,提高了客服語音識別的精確度。
技術領域
本發明實施例涉及電子商務技術領域,尤其涉及一種客服語音識別方法、裝置、服務器及存儲介質。
背景技術
隨著電子商務的發展,電子商務客服的服務質量問題已越來越受重視。對語音客服的服務質量問題進行評判時,通常先將語音客服的音頻數據通過語音識別轉換成文本數據,再對本文數據進行分析,評判服務質量。
目前大多采用語音識別模型將音頻數據轉換成文本數據,例如高斯混合隱馬爾可夫模型、深度學習模型等。這些模型通常采用語音客服的音頻數據進行訓練,然而客服人員在提供服務時,吐字不清晰、語義表達不準確等情況時有發生,這就導致訓練得到的模型存在錯別字率高、角色識別不明確等問題,從而使得模型的識別精確度降低。
發明內容
本發明實施例提供一種客服語音識別方法、裝置、服務器及存儲介質,以提高客服語音識別的精確度。
第一方面,本發明實施例提供一種客服語音識別方法,包括:
對待識別音頻數據進行端點檢測,以獲取多個單句音頻數據;
通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據,所述預設聲學模型基于客服語音數據構建;
通過預設語言模型確定所述多個第一文本數據對應的多個第二文本數據,所述預設語言模型基于線上客服文本數據構建。
進一步的,所述通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據之前,還包括:
通過預設性別分類模型確定每個單句音頻數據的角色性別。
進一步的,所述通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據包括:
若所有單句音頻數據的角色性別都相同,則通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據。
進一步的,所述通過預設語言模型確定所述多個第一文本數據對應的多個第二文本數據之后,還包括:
通過預設角色分類模型確定每個第二文本數據的角色身份,所述預設角色分類模型基于線上客服文本數據構建。
進一步的,所述通過預設性別分類模型確定每個單句音頻數據的角色性別之后,還包括:
若并非所有單句音頻數據的角色性別都相同,則獲取所述待識別音頻數據對應的客服人員性別;
若單句音頻數據的角色性別與所述客服人員性別相同,則確定所述單句音頻數據的角色身份為客服人員;
若單句音頻數據的角色性別與所述客服人員性別不同,則確定所述單句音頻數據的角色身份為用戶。
進一步的,所述通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據包括:
通過預設聲學模型確定已經確定角色身份的所述多個單句音頻數據對應的多個第一文本數據。
進一步的,所述通過預設聲學模型確定所述多個單句音頻數據對應的多個第一文本數據包括:
提取所述多個單句音頻數據對應的多個單句音頻特征;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳樂信軟件技術有限公司,未經深圳樂信軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010699013.8/2.html,轉載請聲明來源鉆瓜專利網。





