[發明專利]一種語音質量檢測的方法以及相關裝置在審
| 申請號: | 201910876980.4 | 申請日: | 2019-09-17 |
| 公開(公告)號: | CN110503982A | 公開(公告)日: | 2019-11-26 |
| 發明(設計)人: | 陳曦明 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60;G10L21/10 |
| 代理公司: | 44285 深圳市深佳知識產權代理事務所(普通合伙) | 代理人: | 吳磊<國際申請>=<國際公布>=<進入國 |
| 地址: | 518057 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音質量檢測 屏幕截圖 失真語音 源語音 獲取設備 情況采集 特征元素 相關裝置 語音采集 語音類型 預設規則 短語音 失真度 匹配 語音 采集 檢測 申請 | ||
本申請公開了一種語音質量檢測的方法以及相關裝置,通過針對不同類型的語音采用對應的策略,即若所述源語音的語音類型為短語音,則獲取設備的屏幕截圖,然后根據所述屏幕截圖的變化情況采集失真語音;接著根據預設規則獲取所述失真語音與所述源語音的失真度,以得到語音質量檢測結果,實現了自動的語音質量檢測過程,且根據設備中的屏幕截圖特征元素的匹配采集失真語音,實現了高質量的語音采集過程,提高了語音質量檢測的精確性并提高了檢測效率。
技術領域
本申請涉及計算機技術領域,尤其涉及一種語音質量檢測的方法以及相關裝置。
背景技術
隨著互聯網技術的發展,在應用場景中對于用戶之間的語音交流變得越來越重要,但是由于網絡傳輸的原因,用戶之間的語音通話質量可能會受到影響,此時需要對語音通話質量進行檢測,以評估語音通話質量并作出相應的優化。
一般,對于語音質量檢測的過程是基于相關人員的手動采集樣本,輸入相關的檢測模型或裝置進行檢測。
但是,由于人工采集的不穩定性,可能造成采集樣本的不準確,尤其是在短語音的場景中,相關人員無法直接知曉語音的播放起止,影響語音質量檢測的準確性;且在大量語音數據的場景中,人工采集需要耗費大量的時間,影響語音質量檢測過程的效率。
發明內容
有鑒于此,本申請第一方面提供一種語音質量檢測的方法,可應用于語音質量檢測系統或程序過程中,具體包括:獲取第一設備的源語音;
根據所述源語音在播放時間段內的變化情況確定所述源語音的語音類型;
若所述源語音的語音類型為短語音,則獲取第二設備的屏幕截圖,所述短語音用于指示所述源語音在播放時間段內為間斷語音,所述第二設備的屏幕截圖用于指示第二設備用于播放所述源語音的界面截圖;
根據所述屏幕截圖的變化情況采集失真語音,所述失真語音與所述源語音具有對應關系;
根據預設規則獲取所述失真語音與所述源語音的失真度,以得到語音質量檢測結果。
優選的,在本申請一些可能的實現方式中,所述根據所述屏幕截圖的變化情況采集失真語音,包括:
確定所述第二設備的屏幕截圖中的特征元素,所述平方差算法基于所述屏幕截圖與所述特征元素的匹配度確定,所述特征元素用于指示所述屏幕截圖中與語音播放相關的元素;
根據所述特征元素的變化情況采集失真語音。
優選的,在本申請一些可能的實現方式中,所述根據平方差算法確定所述第二設備的屏幕截圖中的特征元素,包括:
將所述第二設備的屏幕截圖轉換為灰度圖;
根據平方差算法確定所述灰度圖中的特征元素。
優選的,在本申請一些可能的實現方式中,所述根據所述特征元素的變化情況采集失真語音之前,所述方法還包括:
確定所述源語音的采樣率,以設置為采集參數;
所述根據所述特征元素的變化情況采集失真語音,包括:
根據所述采集參數對所述源語音進行采集,并實時監測音量信息;
調整所述音量信息以使得所述音量信息滿足預設條件,并根據所述特征元素的變化情況采集失真語音。
優選的,在本申請一些可能的實現方式中,所述根據預設規則獲取所述失真語音與所述源語音的失真度,以得到語音質量檢測結果,包括:
根據所述源語音截取所述失真語音的檢測部分,所述檢測部分用于指示所述失真語音與所述源語音相關度最高的部分,所述相關度基于語音起始位置與長度設定;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910876980.4/2.html,轉載請聲明來源鉆瓜專利網。





