[發明專利]語音信號處理方法、設備及存儲介質在審
| 申請號: | 202010581908.1 | 申請日: | 2020-06-23 |
| 公開(公告)號: | CN111768800A | 公開(公告)日: | 2020-10-13 |
| 發明(設計)人: | 曹剛 | 申請(專利權)人: | 中興通訊股份有限公司 |
| 主分類號: | G10L25/03 | 分類號: | G10L25/03;G10L25/24;G10L25/78;G10L15/05;G10L15/02 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 洪銘福 |
| 地址: | 518057 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 信號 處理 方法 設備 存儲 介質 | ||
本申請實施例涉及語音信號處理方法、設備及存儲介質。本申請實施例包括:獲取待檢測幀的音頻特征;獲取語音信號中所述待檢測幀之前預設長度時間窗內的靜音點占比;根據所述音頻特征確定靜音點占比閾值;根據所述靜音點占比和所述靜音點占比閾值判斷所述待檢測幀是否是尾點幀。本申請實施例能夠利用預設長度時間窗內靜音點占比,并使用當前待檢測幀的倒頻譜特征來動態調節靜音點占比閾值,從而克服了固定靜音點占比閾值存在的語音尾點檢測不準確的問題,有效提高了尾點幀檢測的準確性和實時性。
技術領域
本申請實施例涉及但不限于計算機技術領域,尤其涉及一種語音信號處理方法、設備及存儲介質。
背景技術
隨著人工智能的發展,語音識別成為眾多設備的標配,語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別和理解人類口述的語言。
語音尾點檢測在語音識別中起著關鍵性作用,語音尾點檢測即在音頻數據中找到語音的尾點,其準確性對語音識別的準確性起著至關重要的作用。
目前,語音尾點檢測存在語音尾點不易確定的問題,使語音識別的準確率大大降低。
發明內容
本申請實施例提供了語音信號處理方法、設備及存儲介質,能夠提高語音尾點檢測和識別的準確率。
第一方面,本申請實施例提供了一種語音信號處理方法,包括:獲取語音信號中待檢測幀的音頻特征;獲取待檢測幀之前預設長度時間窗內的靜音點占比;根據所述音頻特征得到靜音點占比閾值;根據所述靜音點占比和所述靜音點占比閾值,確定所述語音信號中的尾點幀。
第二方面,本申請實施例提供了一種電子設備,包括:一個或多個處理器;存儲裝置,用于存儲一個或多個程序,當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現第一方面中所述的語音信號處理方法。
第三方面,本申請實施例提供了一種計算機可讀存儲介質,所述計算機可執行指令用于執行第一方面中所述的語音信號處理方法。
本申請實施例包括:獲取語音信號中待檢測幀的音頻特征;獲取所述待檢測幀之前預設長度時間窗內的靜音點占比;根據所述音頻特征確定靜音點占比閾值;根據所述靜音點占比和所述靜音點占比閾值確定所述待檢測幀是尾點幀。本申請實施例能夠利用預設長度時間窗內靜音點占比,并使用當前待檢測幀的倒頻譜特征來動態調節靜音點占比閾值,從而克服了固定靜音點占比閾值存在的語音尾點檢測不準確的問題,有效提高了尾點幀檢測的準確性和實時性。
本申請的其它特征和優點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本申請而了解。本申請的目的和其他優點可通過在說明書、權利要求書以及附圖中所特別指出的結構來實現和獲得。
附圖說明
圖1是本申請一實施例提供的語音信號處理方法流程圖;
圖2是本申請另一實施例提供的語音信號處理方法流程圖;
圖3是本申請另一實施例提供的語音信號處理方法流程圖;
圖4是本申請另一實施例提供的語音信號處理方法流程圖;
圖5是本申請另一實施例提供的語音信號處理方法流程圖;
圖6是本申請一實施例提供的語音識別方法流程圖;
圖7是本申請一實施例提供的語音尾點檢測設備示意圖;
圖8是本申請一實施例提供的語音尾點檢測裝置示意圖;
圖9是本申請一實施例提供的語音識別裝置示意圖。
具體實施方式
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中興通訊股份有限公司,未經中興通訊股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010581908.1/2.html,轉載請聲明來源鉆瓜專利網。





