[發明專利]語音端點檢測方法、裝置、設備及計算機存儲介質有效
| 申請號: | 202010089292.6 | 申請日: | 2020-02-12 |
| 公開(公告)號: | CN111354378B | 公開(公告)日: | 2020-11-24 |
| 發明(設計)人: | 邱廣;馮大航;陳孝良;常樂 | 申請(專利權)人: | 北京聲智科技有限公司 |
| 主分類號: | G10L25/78 | 分類號: | G10L25/78;G10L25/18;G10L25/30;G10L25/27 |
| 代理公司: | 北京三高永信知識產權代理有限責任公司 11138 | 代理人: | 邢少真 |
| 地址: | 100080 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 語音 端點 檢測 方法 裝置 設備 計算機 存儲 介質 | ||
1.一種語音端點檢測方法,其特征在于,所述方法包括:
對音頻信號進行處理,得到所述音頻信號的頻譜圖;
將所述頻譜圖輸入目標檢測模型,所述目標檢測模型用于檢測所述頻譜圖中的有效語音部分;
獲取所述目標檢測模型輸出的所述頻譜圖中有效語音部分的起始位置和終止位置。
2.根據權利要求1所述的方法,其特征在于,所述將所述頻譜圖輸入目標檢測模型之前,包括:
獲取初始目標檢測模型;
獲取訓練數據,所述訓練數據包括樣本頻譜圖,所述樣本頻譜圖具有多個先驗框以及與所述多個先驗框一一對應的損失函數,所述多個先驗框包括多個正樣本和多個負樣本,所述正樣本為有效語音部分大于閾值的先驗框,所述負樣本為有效語音部分不大于所述閾值的先驗框;
根據所述訓練數據對所述初始目標檢測模型進行訓練,得到所述目標檢測模型。
3.根據權利要求2所述的方法,其特征在于,所述獲取訓練數據,包括:
獲取所述樣本頻譜圖,所述樣本頻譜圖具有多個先驗框;
根據損失函數公式確定與所述多個先驗框一一對應的損失函數,所述損失函數公式包括:
L(x,c,l,g)=(Lconf(x,c)/N+αLloc(x,l,g));
所述L為所述損失函數,所述Lloc為位置誤差函數,所述Lconf為置信度誤差函數,所述cx為每個先驗框、邊界框以及有效語音部分的中心坐標在時間軸上的數值,每個所述邊界框為所述初始目標檢測模型對每個所述先驗框經過變換之后得到的框,所述w為每個先驗框、邊界框以及有效語音部分在所述時間軸的方向上的寬度,所述i表示所述多個先驗框中的第i個先驗框,所述j為所述樣本頻譜圖中第j個有效語音部分,所述N為所述先驗框的正樣本數,所述α為指定參數,所述p為有效語音部分,當第i個先驗框與第j個有效語音部分匹配時不匹配時所述c為先驗框屬于有效語音部分的置信度,所述表示第i個先驗框屬于有效語音部分的置信度,所述表示第i個先驗框屬于有效語音部分的預測置信度,所述表示第i個先驗框不屬于有效語音部分的預測置信度,所述Pos為正樣本先驗框,所述Neg為負樣本先驗框,所述m為(cx,w)中的任意一個值,所述l為邊界框的位置預測值,所述為第i個先驗框所對應邊界框的位置預測值,所述g為所述有效語音部分的位置參數,所述表示第j個有效語音部分中心坐標在時間軸上的數值,所述表示第j個有效語音部分在所述時間軸的方向上的寬度,所述表示第j個有效語音部分中心坐標在時間軸上的預測值,所述表示第j個有效語音部分在所述時間軸的方向上的預測寬度,所述表示第i個先驗框中心坐標在時間軸上的數值,所述表示第i個先驗框在所述時間軸的方向上的寬度。
4.根據權利要求1所述的方法,其特征在于,所述獲取所述目標檢測模型輸出的所述頻譜圖中有效語音部分的起始位置和終止位置之后,包括:
將所述有效語音部分的起始位置以及終止位置轉換為時域上的位置。
5.根據權利要求1所述的方法,其特征在于,所述對音頻信號進行處理,得到所述音頻信號的頻譜圖,包括:
對所述音頻信號進行短時傅里葉變換,得到所述音頻信號的頻譜圖。
6.根據權利要求1-5任一所述的方法,其特征在于,所述目標檢測模型包括單發多框檢測器。
7.一種語音端點檢測裝置,其特征在于,所述裝置包括:
處理模塊,用于對音頻信號進行處理,得到所述音頻信號的頻譜圖;
輸入模塊,用于將所述頻譜圖輸入目標檢測模型,所述目標檢測模型用于檢測所述頻譜圖中的有效語音部分;
獲取模塊,用于獲取所述目標檢測模型輸出的所述頻譜圖中有效語音部分的起始位置和終止位置。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京聲智科技有限公司,未經北京聲智科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010089292.6/1.html,轉載請聲明來源鉆瓜專利網。





