[發(fā)明專利]發(fā)音質量檢測方法、系統(tǒng)、移動終端及存儲介質在審
| 申請?zhí)枺?/td> | 202110228528.4 | 申請日: | 2021-03-02 |
| 公開(公告)號: | CN112967736A | 公開(公告)日: | 2021-06-15 |
| 發(fā)明(設計)人: | 陳劍超;肖龍源;李稀敏;葉志堅 | 申請(專利權)人: | 廈門快商通科技股份有限公司 |
| 主分類號: | G10L25/60 | 分類號: | G10L25/60 |
| 代理公司: | 廈門仕誠聯(lián)合知識產權代理事務所(普通合伙) 35227 | 代理人: | 樂珠秀 |
| 地址: | 361009 福建省廈門市*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 發(fā)音 質量 檢測 方法 系統(tǒng) 移動 終端 存儲 介質 | ||
本發(fā)明提供了一種發(fā)音質量檢測方法、系統(tǒng)、移動終端及存儲介質,該方法包括:對待檢測音頻和標準音頻進行音節(jié)對齊和音段分割,得到待檢測音段和目標音段,對待檢測音段和目標音段進行音頻幀對齊,得到對齊路徑;根據(jù)對齊路徑計算待檢測音段與目標音段之間的基頻相似度,對待檢測音段與目標音段進行停頓檢測;根據(jù)停頓檢測結果計算待檢測音段與目標音段之間的停頓相似度,對停頓相似度和基頻相似度進行權值計算得到發(fā)音質量檢測值;若發(fā)音質量檢測值大于檢測閾值,判定待檢測音頻的發(fā)音質量合格。本發(fā)明基于發(fā)音質量檢測值能自動判斷待檢測音頻的發(fā)音質量檢測是否合格,無需采用人工的方式進行音頻數(shù)據(jù)發(fā)音質量檢測,提高了發(fā)音質量檢測的準確性。
技術領域
本發(fā)明涉及音頻檢測技術領域,尤其涉及一種發(fā)音質量檢測方法、系統(tǒng)、移動終端及存儲介質。
背景技術
計算機輔助語言教學是語音技術在語言教學領域發(fā)展的一個重要研究方向,主要的目的是利用計算機來幫助語言學習者更好地掌握一門第二語言。在學習過程中,老師的實時指導和反饋往往能極大地提高學習效率,口語教學尤為明顯,但是傳統(tǒng)教學模式存在明顯的局限性:由于學習者數(shù)量眾多,具有相應專業(yè)技能的師資數(shù)量不能滿足龐大的需求,學習者難以得到即時的反饋,因此,計算機輔助語言教學應運而生,發(fā)音質量檢測作為計算機輔助語言教學的重要內容備受關注。
現(xiàn)有的發(fā)音質量檢測過程中,均是采用人工的方式進行音頻數(shù)據(jù)發(fā)音質量的檢測,進而導致發(fā)音質量檢測準確性低下。
發(fā)明內容
本發(fā)明實施例的目的在于提供一種發(fā)音質量檢測方法、系統(tǒng)、移動終端及存儲介質,旨在解決現(xiàn)有的發(fā)音質量檢測過程中,由于采用人工的方式進行音頻數(shù)據(jù)發(fā)音質量檢測,所導致的發(fā)音質量檢測準確性低下的問題。
本發(fā)明實施例是這樣實現(xiàn)的,一種發(fā)音質量檢測方法,所述方法包括:
獲取待檢測音頻和所述待檢測音頻對應的標準音頻,并對所述待檢測音頻和所述標準音頻進行音節(jié)對齊;
根據(jù)音節(jié)對齊結果對所述待檢測音頻和所述標準音頻進行音段分割,得到待檢測音段和目標音段,并對所述待檢測音段和所述目標音段進行音頻幀對齊,得到對齊路徑;
根據(jù)所述對齊路徑計算所述待檢測音段與所述目標音段之間的基頻相似度,并分別對音頻幀對齊后所述待檢測音段與所述目標音段進行停頓檢測;
根據(jù)停頓檢測結果計算所述待檢測音段與所述目標音段之間的停頓相似度,并對所述停頓相似度和所述基頻相似度進行權值計算,得到發(fā)音質量檢測值;
若所述發(fā)音質量檢測值大于檢測閾值,則判定所述待檢測音頻的發(fā)音質量合格。
更進一步地,所述對所述待檢測音段和所述目標音段進行音頻幀對齊的步驟包括:
分別提取所述待檢測音段和所述目標音段中音頻幀的梅爾倒譜系數(shù),得到待檢測特征序列和目標特征序列;
分別獲取所述待檢測特征序列和所述目標特征序列的序列長度,得到第一長度和第二長度,并根據(jù)所述第一長度和所述第二長度構建音頻幀對齊矩陣;
根據(jù)所述音頻幀對齊矩陣對所述待檢測音段和所述目標音段進行音頻幀對齊,得到所述對齊路徑。
更進一步地,所述根據(jù)所述對齊路徑計算所述待檢測音段與所述目標音段之間的基頻相似度所采用的計算公式為:
其中,DTW是所述基頻相似度,Q是所述待檢測特征序列,C是所述目標特征序列,w是所述對齊路徑,wk是所述對齊路徑上第k個點在所述音頻幀對齊矩陣中的坐標。
更進一步地,所述分別對音頻幀對齊后所述待檢測音段與所述目標音段進行停頓檢測的步驟包括:
分別獲取所述待檢測音段和所述目標音段中發(fā)音單元的起止位置;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門快商通科技股份有限公司,未經廈門快商通科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110228528.4/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:顯示組件、顯示屏及電子設備
- 下一篇:基于謹慎度的用戶身份識別方法





