[發明專利]彩鈴識別的方法及系統、電子設備及存儲介質有效
| 申請號: | 202010953701.2 | 申請日: | 2020-09-11 |
| 公開(公告)號: | CN112087726B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 鄧艷江;羅超;胡泓;李巍 | 申請(專利權)人: | 攜程旅游網絡技術(上海)有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G10L19/02;G10L17/04;G10L15/26 |
| 代理公司: | 上海弼興律師事務所 31283 | 代理人: | 楊東明;張冉 |
| 地址: | 200335*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 識別 方法 系統 電子設備 存儲 介質 | ||
1.一種彩鈴識別的方法,其特征在于,包括以下步驟:
將輸入的音頻信號轉換為文本;
判斷是否存在與所述文本匹配的關鍵詞;
若是,則將所述音頻信號識別為彩鈴;
若否,則將所述音頻信號輸入至彩鈴分類模型,并根據所述彩鈴分類模型的預測結果確定所述音頻信號是否為彩鈴;其中,所述彩鈴分類模型基于訓練樣本訓練得到,所述訓練樣本包括彩鈴樣本以及包括人聲的非彩鈴樣本;通過所述彩鈴分類模型確定為彩鈴的所述音頻信號為伴隨有背景音樂的人聲播報彩鈴;
所述將所述音頻信號輸入至彩鈴分類模型,根據所述彩鈴分類模型的預測結果確定所述音頻信號是否為彩鈴,具體包括:
對所述音頻信號進行分幀處理,得到若干幀子音頻信號;
分別對各幀子音頻信號進行檢測,得到有效幀,其中,所述有效幀為包括語音區的子音頻信號;
將所述有效幀輸入至彩鈴分類模型,得到所述有效幀的預測結果;
根據所有有效幀的預測結果確定所述音頻信號是否為彩鈴。
2.如權利要求1所述的方法,其特征在于,所述根據所有有效幀的預測結果確定所述音頻信號是否為彩鈴,具體包括:
若有效幀為彩鈴的幀數與所有有效幀的幀數之比大于預設值,則確定所述音頻信號為彩鈴,否則,確定所述音頻信號不為彩鈴。
3.如權利要求1所述的方法,其特征在于,所述將所述有效幀輸入至彩鈴分類模型具體包括:
對所述有效幀進行加窗和傅里葉變換的預處理,得到所述有效幀的頻譜特征;
將所述有效幀的頻譜特征輸入至彩鈴分類模型。
4.如權利要求1-3中任一項所述的方法,其特征在于,所述彩鈴分類模型為神經網絡模型。
5.一種彩鈴識別的系統,其特征在于,包括轉換模塊、判斷模塊、分類模塊;
所述轉換模塊用于將輸入的音頻信號轉換為文本;
所述判斷模塊用于判斷是否存在與所述文本匹配的關鍵詞,并在是的情況下將所述音頻信號識別為彩鈴,以及在否的情況下調用所述分類模塊;
所述分類模塊用于將所述音頻信號輸入至彩鈴分類模型,并根據所述彩鈴分類模型的預測結果確定所述音頻信號是否為彩鈴;其中,所述彩鈴分類模型基于訓練樣本訓練得到,所述訓練樣本包括彩鈴樣本以及包括人聲的非彩鈴樣本;通過所述彩鈴分類模型確定為彩鈴的所述音頻信號為伴隨有背景音樂的人聲播報彩鈴;
所述分類模塊具體包括:
分幀單元,用于對所述音頻信號進行分幀處理,得到若干幀子音頻信號;
檢測單元,用于分別對各幀子音頻信號進行檢測,得到有效幀,其中,所述有效幀為包括語音區的子音頻信號;
輸入單元,用于將所述有效幀輸入至彩鈴分類模型,得到所述有效幀的預測結果;
確定單元,用于根據所有有效幀的預測結果確定所述音頻信號是否為彩鈴。
6.如權利要求5所述的系統,其特征在于,所述確定單元具體用于在有效幀為彩鈴的幀數與所有有效幀的幀數之比大于預設值的情況下,確定所述音頻信號為彩鈴,否則確定所述音頻信號不為彩鈴。
7.一種電子設備,包括存儲器、處理器以及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1-4中任一項所述的彩鈴識別的方法。
8.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現如權利要求1-4中任一項所述的彩鈴識別的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于攜程旅游網絡技術(上海)有限公司,未經攜程旅游網絡技術(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010953701.2/1.html,轉載請聲明來源鉆瓜專利網。





